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BESCHREIBUNG 
Polymorphes Maschennetzwerk fur Bildverarbeitungs system 

HINTERGRUND DER ERFINDUNG 

1. Anwendungsbereich der Erfindung 

Die Erfindung bezieht sich auf einen Feldprozessor, der aus 
einem Netzwerk von Verarbeitungselementen besteht, und dabei 
insbesondere auf ein Feldverarbeitungsnetzwerk, bei dem jedes 
Verarbeitungselement in einem Feld von Verarbeitungselementen 
mit einem Verbindungssteuermechanismus, auf den das Programm 
zugreift, zusammen mit steuerbaren begrenzten Maschennetzzwi- 
schenschaltungen zu entsprechenden Verbindungselementen ausge- 
stattet ist, um eine programmierbare Auswahl an Netzwerkkonf i- 
gurationen zu bieten. 

2. Beschreibung der Technik 

Die folgenden Verof fentlichungen spiegeln den Stand der 
Technik wider: 

Verof fentlichte Artikel 

1. Sternberg, "Biomedical image processing", Computer, Jan. 
1983. Dieser Artikel beschreibt ein Feld zellularer Automaten 
von identischen Zellen, die mit ihrem nachsten Nachbar fur die 
iterative Nachbarschaftsverarbeitung von digitalen Bildern 
verbunden sind. Ein Serpentinenschieberegister konfiguriert 
seriell Nachbarschaf tseingange fiir die 3x3 Nachbarschaf t. 

2- Turney und andere, "Recognizing Partially Occluded Parts", 
IEEE Transactions on Pattern Analysis and Machine 
Intelligence, Juli, 1985, SS. 410-421. In diesem Artikel 
werden zahlreiche Techniken aufgezeigt, einschlieBlich Hough- 
Transformation und gewichtetes Schablonen-Matching . 
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3. Mudge und andere, "Efficiency of Feature Dependent 
Algorithms for the Parallel Processing of Images", IEEE 0190- 
3918/83/0000/0369 1983 r 369-373, zeigt, wie die Architektur 
eines Bildverarbeitungssystems von einer Konf iguration in Form 
von zahlreichen Unterbildprozessoren profit ieren kann, bei 
denen die Verarbeitungselemente fiber eine Art Netzwerk mitein- 
ander kommuniz ieren. Die Autoren erklaren den Unterschied 
zwischen f unktionsabhangigen Algorithmen und funktionsunabhan- 
gigen Algorithmen. 

4. Sternberg und andere, "Industrial Morphology". In diesem 
Artikel wird die Kombination eines Einzelsystems fiir die 
Bildverarbeitung und die Strukturerkennung beschrieben. 

5. D.E. Shaw, "The NON-VON Supercomputer", internal report, 
Columbia University, Aug. 1982. In diesem Bericht wird ein 
paralleles System mit einer I/O-Umschaltung in jedem Verarbei- 
tungselement und Flag-Registern gezeigt, die einzelne PEs 
aktivieren und deaktivieren. 

6. M.J. Kimmel, R.S. Jaffe, J.R. Mandeville und M. A. Lavin, 
"MITE: Morphic Image Transform Engine, An Architecture for 
Reconf igurable Pipelines of Neighborhood Processors, IBM 
RC11438, 10. Okt. 1985. In diesem Artikel wird ein wiederkon- 
f igurierbares Netzwerk von Verarbeitungselementen beschrieben, 
die zahlreiche Zwischenschaltungen von PE zu PE liber Busver- 
bindungen unter Bedienerkontrolle ermoglichen. 

7. A.J. Kessler und J.H. Patel, "Reconf igurable Parallel 
Pipelines for Fault Tolerance", IEEE, CH1813-5/82/0000/0118, 
1982. In diesem Artikel wird eine wiederkonf igurierbare 
Pipeline-Verbindung fiir Graceful-Degradation beschrieben. 

8. S.R. Sternberg, "Parallel Architecture for Image 
Processing", IEEE, CH1515-6/79/0000-0712 , 1979 zeigt ein PE- 
Netzwerk mit voller Konnektivitat . 
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9. T.N. Mucige, E.J. Delp, L.J. Siegel und H.J. Siegel, "Image 
Coding Using the Multimicroprocessor System PASM" , IEEE, 
82CH1761-6/82/0000/0200, 1982.. In diesem Artikel wird eine 
Verarbeitungselementzwischenschaltung beschrieben, die durch 
ein Zwischenschaltnetzwerk hergestellt wird. 

10. S.R. Sternberg, "Language and Architecture for Parallel 
Image Processing", Pattern Recogni tion in Practice, North- 
Holland Publishing Co., 1980. Hier wird ein Complexes Netzwerk 
von PEs sowie dessen Betrieb beschrieben. 

11. Z. Chen, CC change und T.L. Chia, 1985, IEEE Computer 
Society Workshop on Computer Architecture for Pattern Analysis 
and Image Database Management, Miami Beach, Florida, 18.-20. 
November 1985, Seiten 80-87. Hier wird ein wiederkonf igur ier- 
barer zellularer Feldprozessor beschrieben, der iiber eine 
Architektur aus speicherverstarkten Prozessoren verfiigt, die 
iiber Omega-Net zwerke und einen Algorithmus zur erneuten Konfi- 
gurierung des Systems verbunden sind. 

12. D.G. Wallbrook und D.J. Woollons Electronics Letters Vol. 
7, Nr., 15. Juli 1971, Seiten 385-387. In diesem Artikel wird 
ein paralleler Verarbeitungscomputer zur Strukturerkennung 
beschrieben, der aus einem rechteckigen Feld von identischen 
zwischengeschalteten Verarbeitungsmodulen besteht, die tiber 
allgemeine Daten- und Bef ehls-Highways mit einer Befehlsein- 
heit verbunden sind. 

* Die US-Patentschrift 4,174,514, 13. November 1979 zeigt 
einen Feldprozessor mit benachbarten Verarbeitungselementen, 
die fur den gegenseitigen Zugriff auf Bilddaten in iiberlappen- 
den Feldern zweier benachbarter Bild-Slices zwischengeschaltet 
sind. 

* Die US-Patentschrift 4,215,401, CELLULAR DIGITAL ARRAY 
PROCESSOR, 29. Juli 1980, beschreibt einen Feldprozessor, bei 
dem jede "Verarbeitungselementzelle" iiber zwei Akkumulatoren 
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verfugt, die die Zelle (mit Ausnahme der Zellen am Feldrand) 
mit den beiden Nachbarzellen entlang einer Achse sowie mit den 
beiden Nachbarzellen entlang der orthogonalen Achse verbinden. 

* Die US-Patentschrift 4 , 380 , 046, Fung, MASSIVELY PARALLEL 
PROCESSOR COMPUTER, 12. April 1983, zeigt einen Bildprozessor , 
der eine rHumliche Translation durch vertikales Oder horizon- 
tales Verschieben oder "Gleiten" von Bits zu benachbarten 
Verarbeitungselemente und P-Registern zu P-Registern durch- 
fiihrt, sofern dies von einem anderen, sogenannten G-Register 
erlaubt wird. Jedes Verarbeitungselement umfaBt eine Arithme- 
tic, Logik- und Routing-Einheit (ALRU) , eine I/O-Einheit und 
eine lokale Speichereinheit (LMU) - Die ALRU besteht aus drei 
wichtigen Komponenten : einem Binarzah- 

ler/Schieberegisteruntereinheit, einer logischen Slider-Unter- 
einheit (P-Register) und einer Maskenuntereinheit (G- 
Register) . 

* Die US-Patentschrift 4,398,176, Dargel und andere, DATA 
ANALYZER WITH COMMON DATA/ INSTRUCTION BUS, 9. August 1983, 
beschreibt ein Bildverarbeitungsf eld, bei dem jedes Verarbei- 
tungselement iiber externe Bef ehlssteuerleitungen verfiigt, um 
zu prufen, ob Busdaten als Befehl oder als Daten verwendet 
werden. Jedes Verarbeitungselement umfaBt auch einen Mechanis- 
mus, der aus der Bitstruktur eines Befehls festlegt, ob der 
Befehl lokal oder global ist, und der die Weiterleitung 
stoppt, wenn es sich um einen lokalen Befehl handelt- 

* Die US-Patentschrift 4,601,055, Kent, IMAGE PROCESSOR, 15. 
Juli 1986, zeigt einen niedrigstuf igen Ikone-zu-Ikone-Prozes- 
sor mit Pixel-um-Pixel-Vorwartstransf ormation und Pixel-um- 
Pixel-Ruckwartstransf ormation . 

* Die US-Patentschrift Nr, 3,287,702 bezieht sich auf einen 
parallelen Netzwerkcomputer mit Verarbeitungselementen, die 
uber Schaltungen verfugen, mit denen die Steuersignale, die 
von einem zentralen Steuermittel als Antwort auf interne 
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Bedingungen innerhalb der Verarbeitungselemente empfangen 
werden, geandert werden konnen. 

Die Verfahren auf dem Stand der Technik ermoglichen eine 
permanente Konf iguration von Verarbeitungselementen in einer 
Pipeline oder einem anderem S tr uktur b i ldver ar be itungs system. 
Nach dem Stand der Technik wird ein Bildverarbeitungssystem 
iiber Schaltnetzwerke und Busse wiederkonf iguriert. GemaB dem 
Stand der Technik ist ein Bittransfer zu benachbarten Verar- 
beitungselementen moglich. Bei den Verfahren auf dem stand der 
Technik ist jedoch von keiner Erfindung die Rede, die sehr 
schnelle Schaltung innerhalb des Verarbeitungselements ermog- 
licht, das als polymorphes Maschennetz programmiert werden 
kann, urn die Konf iguration dynamisch zu den Daten zu optimie- 
ren, die in folgenden Konf igurationen verarbeitet werden: 
Zeichenkette, Maschennetz, Baum, Wiirfel, Pyramide. 

Zellulare Automaten sind fiir die Bildverarbeitung, Computer 
Vision und andere Berechnungen in der Physik sehr niitzlich. 
Alle bestehenden Zwischenschaltnetzwerke fiir zellulare Automa- 
ten gehen von einer festen Struktur wie beispielsweise einer 
Zeichenkette, einem Maschennetz, einem Baum, einem Wiirfel oder 
einer Pyramide, usw. aus. Jede Struktur eignet sich fur 
bestimmte Arten von Berechnungen, ist jedoch fiir Berechnungen 
ungeeignet, die nicht der Struktur entsprechen. Da die Netz- 
werkzwischenschaltstruktur eingebaut, d.h. f estinstalliert 
ist, kann diese selbst bei Erfassung einer Nichtiibereinstim- 
mung nicht geandert werden- Bei Nichtubereinstimmung ist eine 
geringe Leistungsf ahigkeit zu verzeichnen. 

Ein NxN-Maschennetz beispielsweise ist eine optimale Verbin- 
dung fiir lokale Operationen bei der B i ldver ar be itung. Die 
Leistung dieses Netzwerks ist bei der Berechnung globaler 
Operationen gering (es werden z.B. N Zyklen zur Berechnung von 
MINIMUM, einer linearen Komplexitat, benotigt) . Auf der 
anderen Seite ist eine Baumverbindung ideal fiir die Berechnung 
von MINIMUM (es werden nur log N Zyklen, eine logarithmische 
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Komplexitat, benotigt) . Diese Verbindung leistet bei der 
Berechnung von lokalen Operationen eines Bildes jedoch nicht 
viel, da die Nachbarschaftsverbindung feh.lt. 

Neben der allgemein mangelhaften Leistungsf ahigkeit bei der 
Berechnung im Fall einer Verbindung, die nicht mit dem Algo- 
rithmus ubereinstimmt , ist die Feststruktur auch beim Entwurf 
eines Algorithmus unflexibel. Dies liegt vor allem bei den 
Beschrankungen im DatenfluB. Bei der Zeichenkettenverbindung 
beispielsweise geht der DatenfluB nur in eine Richtung, d.h. 
von links nach rechts. Eine solche Einschrankung begrenzt auch 
den Algorithmusbereich: nur Algorithmen mit einem 
"Zeichenkettendatenf luB" konnen vom » Zeichenkettennetzwerk" 
profitieren. In dieser Hinsicht sind die festen Netzwerke nur 
fur bestimmte Zwecke geeignet und haben einen engen Anwen- 
dungsr ahmen . 

Ein weiterer Nachteil der festen Verbindungsstruktur besteht 
darin, daB ikonische und Zwischenverarbeitung nicht gleichzei- 
tig leistungsstark unterstiitzt. Dieser Nachteil ist vor allem 
bei einer wichtigen Anwendung von zellularen Automaten augen- 
fallig, namlich bei der Computer Vision, bei der sowohl ikoni- 
sche (oder Bild-) Verarbeitung als auch die Transformation von 
ikonischen zu symbolischen Daten (genannt Zwischenstuf enverar- 
beitung) zwei integrale Bestandteile sind. Aus diesem Nachteil 
ergibt sich ein I/O-Problem, da das Bild nach der ikonischen 
Verarbeitung auBerhalb des Netzwerks fxir die weitere Zwischen- 
verarbeitung gesendet werden muB. 

ZUSAMMENFASSUNG DER ERFINDUNG 

Gegenstand der Erfindung ist es, eine schnelle Konnektivitat 
mit Programmzugrif f auf jedes Verbindungs element in einem Feld 
zu ermoglichen, so daB die Verarbeitungs element e auf effektive 
Art und Weise programmierbar gruppiert werden konnen, ohne den 
Kostenaufwand fiir komplexe Verbindungen zu haben, die fur 
universelle Konnektitat benotigt werden. 

YO 986 025 



- 7 - 

Ein weiterer Gegenstiand cier Erfindung ist es, eine angemessene 
programmierbare Steuerung der Konnektivitat jedes Verarbei- 
tungselements in einem Feld zu bieten, so daB die Verarbei- 
tungselemente von Zeit zu Zeit programmierbar umgruppiert 
werden konnen, und zwar unter der adapt iven Steuerung eines 
Computers , der den Bedarf nach einer optimierten Umgruppierung 
feststellt, oder unter Aufsicht eines Bedieners, der den 
Bedarf einer optimierten Umgruppierung vorsieht. 

Ein weiterer Gegenstand der Erfindung ist es, eine externe 
Speicherdatenverbindung zum Verarbeitungs element zu ermogli- 
chen, bei dem eine bestimmte Hardware umgangen werden kann und 
zusatzliche Operationsf lexibilitat erreicht wird. 

Eine Funktion der Erfindung gemaB den Anspriichen besteht in 
der Verwendung eines Feldes von polymorphen Maschennetzverbin- 
dungselementen, die jeweils uber Verarbeitungsf ahigkeiten 
verftigen, die in einer Steuer- und Recheneinheit mit einem 
Speicher integriert sind, und des weiteren uber programmier- 
bare Verbindungssteuerfahigkeiten mit geographischen Zielver- 
bindungen und logischen Verbindungen verfiigen. 

Eine weitere Funktion der Erfindung gemaB den Anspriichen 
besteht in der programmierbaren KurzschluBfahigkeit im 
polymorphen Maschennetzverbindungselement. Mit der KurzschluB- 
fahigkeit kann eine Reihe von auftretenden Verarbeitungsele- 
menten als Drahtverbindungen bei der Datentibertragung von 
einem sendenden PE zu einem ferngelegenen PE ohne Zyklusverzo- 
gerung verwendet werden. 

Eine weitere Funktion der Erfindung gemaB den Ansprtichen 
bezieht sich auf ein "polymorphes Maschennetzwerk" , das ein 
zusammengesetztes Netzwerk aus einem herkommlichen Maschennetz 
extern zu jedem PE und einem internen Netzwerk innerhalb jedes 
PE ist, urn Standardstrukturen und andere neue nutzliche 
Strukturen uber Software-Steuerung unterzubringen, so daB die 
Verbindung der Berechnung angepaBt werden kann. Durch die 
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"polymorphe" Funktion kann das Netzwerk sich selbst adaptiv 
"umf ormen 11 r um ein flexibles Algorithmus-Design zu ermoglichen 
und groBere Anwendungsbereiche abzudecken. 

Eine spezielle Funktion im Zusammenhang mit Computer Vision 
unterstiitzt die Zwischenstuf enverarbeitung (ikonische zu 
symbolische Transformation) durch das polymorphe Maschennetz, 
so daB eine effiziente Architektur entsteht f bei der I/O- 
Probleme vermieden werden. 

Eine weitere besondere Funktion der Erf indung gemaB den 
Anspriichen bezieht sich auf Flag-Register in den Verarbei- 
tungselementen, die fiir bedingte Operationen, einschlieBlich 
Wiederkonfiguration fiir adaptive Selbstoptimierung und Fail- 
Soft-Fahigkeit benutzt werden. 

Eine weitere niitzliche Funktion der Erf indung gemaB den 
Anspriichen bezieht sich auf eine begrenzte Anzahl von 
Multibit-Strukturregistern, die jeweils auf eine begrenzte 
Anzahl von Hardware-Strukturen zugreifen, die iiber die 
Software ausgewahlt werden konnen und die besonders bei zellu- 
laren Automaten niitzlich sind, wobei die Strukturen vom poly- 
morphen Maschennetz gebildet werden konnen. Zu diesen Struktu- 
ren gehoren Busse r mehrere Baume, Wiirfel und Pyramiden, die 
jeweils optimal fiir entsprechende Berechnungsarten sind und 
iiber einen Crossbar-Schalter als Antwort auf eine Bitstruktur 
in einem ausgewahlten Strukturregister ausgewahlt werden 
konnen . 

Ein Vorteil der Erf indung liegt in der hohen DurchlaBgeschwin- 
digkeit zu relativ niedrigen Kosten, die mit Hilfe program- 
mierbarer begrenzter Konnektivitat innerhalb des Verarbei- 
tungselements erreicht wird, um die Optimierung einer Feldver- 
bindung von Verarbeitungselementen physisch und elektronisch 
zu ermoglichen. 

Ein weiterer Vorteil besteht darin, daB die Ergebnisse der 
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Zwischenstuf enverarbeitung im Zusammenhang mit der Programmie- 
rung verwendet werden konnen, urn eine adaptive Wiederkonf igu- 
ration effizient als Verb indungsfunkt ion zwischen der Program- 
mierung und den Zwischenergebnissen der Verarbeitung zu ermog- 
lichen. Das bedeutet, daB die Zwischendaten verwendet werden 
konnen, um eine adaptive Optimierungsumgruppierungsf unktion zu 
aktivieren sowie eine adaptive Selbstoptimierung und Fail- 
Sof t-Fahigkeiten . 

Ein weiterer Vorteil liegt in der Einfachheit und dem zweidi- 
mensionalen Aspekt der Erfindung, bei der zahlreiche Zwischen- 
schaltverarbeitungselemente auf einer kleinen Zahl von Chips 
in Feldern angeordnet werden konnen. 

Die oben genannten Aspekte und andere Gegenstande, Funktionen 
und Vorteile der Erf indung gemaB den Anspriichen gehen aus der 
nachfolgenden Beschreibung eines bevorzugten Ausfiihrungsbei- 
spiels der Erf indung anhand der Begleitzeichnungen noch naher 
her vor . 

KURZE BESCHREIBUNG DER ZEICHNUNGEN 

FIG. 1 ist eine Systemblockdiagramm eines Bildprozessors, der 
aus einem Netzwerk von polymorphen Maschenverarfaeitungselemen- 
ten besteht, wobei ein Verarbeitungselement als Funktions- 
blockdiagramm gezeigt wird. 

FIG. 2 ist ein Diagramm der Schaltf ahigkeit eines Verbindungs- 
steuermechanismus CCM eines polymorphen Maschenverarbeitungs- 
elements- 

FIG. 3 ist ein Funktionsblockdiagramm des Verbindungssteuerme- 
chanismus eines polymorphen Maschenverarbeitungselements . 

FIG. 4 ist ein Diagramm, das die Bildung linearer Zeichenket- 
tenfelder von polymorphen Maschenverarbeitungselementen zeigt 
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FIG. 5 ist ein Diagramm, das die Bildung der Reihenbaume von 
polymorphen Maschenverarbeitungselementen zeigt. 

FIG. 6 ist ein Diagramm einer anderen Ansicht der Reihenbaume. 

FIG. 7-10 sind vereinfachte Diagramme, die einen Chipbereichs- 
vergleich und eine Kommunikationsentf ernungsverbesserung 
zeigen, die sich aufgrund der Verwendung der polymorphen 
Maschenverbindungselemente ergeben haben. 

FIG. 11 ist ein Diagrams* mit Umkehrreihenbaumen von polymor- 
phen Maschenverarbeitungselementen . 

FIG. 12-2 0 sind Diagramme mit ausgewahlten Feldkonf iguratio- 
nen, die durch die programmierbare Verbindung von polymorplien 
Maschenverbindungselemente leicht hergestellt werden konnen. 

FIG. 21 ist ein genaues Blockdiagramm eines einzelnen polymor- 
phen Maschenverarbeitungselements entsprechend dem bevorzugten 
Ausfuhrungsbeispiel der Erfindung. 

BESCHREIBUNG EINES BEVORZUGTEN AUSFUHRUNGSBEISPIEIiS DER 

ERFINDUNG 

FIG. 1 zeigt ein polymorphes Maschennetzwerk fur ein Bildver- 
ar be itungs system, das aus einem MxM Fled 1 von Verarbeitungs- 
elementen 2 unter Steuerung eines Host-Computers H 3 besteht. 
Jedes Verarbeitungselement hat eine begrenzte Menge von 
Verbindungen ; im bevorzugten Ausfiihrungsbeispiel sind vier 
Verbindungen vorhanden, eine Verbindung zu jedem der orthogo- 
nalen (nicht-diagonalen) Nachbarn. Diese orthogonalen Nachbarn 
werden als Kartesische Nachbarn bezeichnet. Die orthogonalen 
Verbindungen werden fur das Verarbeitungselement 4 mit den 
direktionalen Idenf ikationen NESW gekennzeichnet . Diese 
Verbindungen sorgen dafur, da0 der Ausgang eines beliebigen 
Verarbeitungselements direkt zu einer begrenzten Anzahl von 
Nachbarn (vier im bevorzugten Ausfiihrungsbeispiel) gefuhrt 
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wird. Die allgemeine Programmier- und Housekeeping-Steuerung 
wird liber Bus 9 vom Host-Computer 3 dur chgef iihrt . 

Ein Ver ar bei tungs element wird genauer gezeigt. Das Verarbei- 
tungselement 5 wird vergroBert gezeigt, um Platz fur die 
internen Organe ALU 6, MEM 7, CCM 8 sowie die NESW-Verbindun- 
gen zu haben. 

t 

Jedes Verarbeitungselement (PE) im bevorzugten Ausf iihrungsbei- 
spiel verfiigt uber vier Kartesische Verbindungen. Die Kartesi- 
schen Verbindungen werden aus praktischen Erwagungen als NESW 
bezeichnet. Sie sind mit den benachbarten PEs in der angegebe- 
nen Richtung verbunden. Dieses einfache Maschennetz von 
Kartesischen Verbindungen ist ohne den CCM 8 in der Lage, 
Verbindungen zum benachbarten PE herzustellen. Dies ist bei 
der Bildverarbeitung eine wichtige Funktion. Diese einfache 
Maschenvorrichtung ist fur die Technologie mit sehr hohem 
Integrationsgrad (VLSI) geeignet. 

Nicht-Kartesische PEs sind fur die direkte Verbindung nicht 
angeschlossen. Diagonale Verbindungen und Fernverbindungen 
sind bei Drahten oder Metallisierung nicht moglich. Diese 
Verbindungen komplizieren den HerstellungsprozeB; Drahtbiindel 
fiihren zu Masse und Entf ernung mit der inharenten Lichtge- 
schwindigkeitsver zogerung . 

Im bevorzugten Ausfuhrungsbeispiel wird auf die Nicht-Kartesi- 
schen PEs uber auftretende Kartesische PEs durch die program- 
mierte steuerung ihrer entsprechenden CCM 8-Fahigkeiten 
zugegriffen. Die Struktur der CCM 8-Verbindung sieht so aus, 
daB der Eingang zum gewunschten Ausgang kurzgeschlossen wird. 
Die Verbindung kann das Muster eines Turms im Schach (gerade 
Kartesisch mit optionaler Erweiterung) oder eines Pferdes 
(Kartesisch X, Kartesisch Y = = remote of f -Cartesian) haben, 
jedoch nicht das Muster des Laufers (diagonal mit optionaler 
Erweiterung) . Komplexe Routing-Strukturen konnen eingerichtet 
werden. Ein komplexes Routing zu einem Nicht-Kartesischen Ziel 
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kann so eingerichtet werden, daB eine grofie Anzahl von PEs 
ohne Zyklusverzogerung durchlaufen wird. 

Als Alternative zu den einfachen Kartesischen Verbindungen im 
bevorzugten Ausfiihrungsbeispiel kann die begrenzte Menge der 
PE-PE-Verbindungen auch Verbindungen zu diagonal benachbarten 
PEs umfassen. Direkte Verbindungen zu sehr weit entfernten PEs 
sind jedoch zu komplex, da diese Verbindungen unter der 
Progrararasteuerung entsprechend der Erf indung durch Kombinatio- 
nen von Kartesischen Oder anderen einfachen Verbindungen 
hergestellt werden konnen. 

FIG. 2 ist ein Diagramm der Schaltfahigkeit des Verbindungs- 
steuermechanismus CCM 8, der in FIG. 1 gezeigt wurde. Die 
wichtigste Funktion ist der Betrieb als Schaltnetzwerk, um 
eine der NESW-Verbindungen in der X-Querachse mit einer der 
NESW-Verbindungen in der Y-Querachse mit Hilfe der Bitwerte in 
einem Strukturregister zu verbinden. Im bevorzugten Ausfiih- 
rungsbeispiel wird eine Auswahl zwischen den Strukturregi stern 
getroffen, wobei die Auswahl des Strukturregister s von einem 
Bitwert in einem Strukturauswahlregister gesteuert wird. FIG. 
2 liegt in Diagraramform vor und zeigt keine Details der 
eigentlichen Hardware. Im bevorzugten Ausfiihrungsbeispiel 
werden nicht alle Verbindungen , die in der 4x4 Matrix zur 
Verfiigung stehen, auch bendtigt, obgleich alle verfiigbar sind. 
Die Matrix 10 hat Eingange 11 in Y-Dimension mit Verbindungen 
zum Leiter 12 in X-Dimension. Wie gezeigt wurde dies einge- 
richtet f um den N Leiter 13 iiber die Verbindungselektronik 14 
und 15 sowie den Schnittpunkt 16 mit der E-Verbindung 17 zu 
verbinden. Andere Verbindungen zu den SWN-Verbindungen IB, 19 
und 20 konnen alternativ oder gleichzeitig aktiviert wird. Die 
Steuerung liegt bei den Bitwerten des Strukturregisters 21 
oder den Bitwerten des Strukturregisters 22. Die Auswahl des 
strukturregisters erfolgt durch das Strukturauswahlregister 
23. Aus dem Schragstrich der Verbindungsleitung zu 16 geht 
hervor r daB die Strukturregister 21 und 22 jeweils 16 Bits 
haben. Verbindungen zu den Verbindungsleitungen 24, 25 und 26 
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sind ebenfalls moglich. Der Crossbar-Schalter 10 stellt eine 
Oder zahlreiche der 16 Verbindungen her, die von den Bitwerten 
in den ausgewahlten Strukturregistern 21 Oder 22 gesteuert 
werden - 

Jedes Verarbeitungselement ist mit einem oder mehreren seiner 
Nachbarn verbunden, je nach Steuerung der Bitwerte in einem 
der beiden Strukturregister. Ein sofortiger Wechsel der 
Verbindung kann einfach durch Umschalten auf das andere 
Strukturregister erfolgen. Die Auswahl der Strukturregister 
wird von den Bitwerten in einem einfachen binaren Strukturaus- 
wahlregister vorgenommen. Zum besseren Verstandnis kann ein 
Strukturregister als Standardstruktur register bzw. alternati- 
ves Strukturregister angesehen werden, auf das ein 1- oder 0- 
Wert im binaren Strukturauswahlregister zugreift. 

FIG. 3 ist ein Funktionsblockdiagramm des CCM 8 von FIG. 1, 
der die in FIG. 2 beschriebenen Schaltf ahigkeiten implemen- 
tiert und bestimmte andere Richtungs- und Logikfunktionssteue- 
rungen dur chf tihrt . Eine vereinfachte Logikverbindungs- 
Capability 30 wird fur AND-, OR-, XOR (Exklusiv OR)- und 
ANDAIiIiBIT-Capability gezeigt. Es stehen noch andere Capabili- 
ties zur Verfugung, mit der Komplexitat erhohen sich jedoch 
die Kosten. Der Verbindungssteuermechanismus empfangt Flag- 
Eingange, die im ersten Flag-Register Fl 31 und im zweiten 
Flag-Register F2 32 gespeichert werden. Diese Flags konnen 
weitergeleitet und zur Anderung der steuerung verwendet 
werden. Die Schieberegistermaske 33 sendet die Ausgange SRM 34 
TRUE und SRM 35 COMPLEMENT, die zur Auswahl einer begrenzten 
Untermenge der SRX 37- und SRY 39-Bitwerte verwendet werden, 
zur steuerlogikverbindungsbox 30. 

Das X-Register 36 und der SRX-Shifter 37 steuern die logische 
Verkniipfung und die geometrische Verbindung zu einem benach- 
barten Verarbeitungselement in X-Dimension. Das Y-Register 38 
und das Schieberegister Y SRY 39 dagegen steuern die geometri- 
sche und logische Auswahl in Y-Dimension. Gewohnlich enthalten 
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das X-Register 36 und das Y-Register 38 die Kartesischen 
Koordinaten eines Verarbeitungselements im System. Die Shifter 
SRX 37 und SRY 39 lei ten in Verbindung mit SRM 33 benachbarte 
Bitgruppen von X und Y ab. Die genauen Funktionen von FIG, 3 
sind in zwolf Beispielen dargestellt, die zwolf verschiedene 
Strukturen des polymorphen Maschennetzes beschreiben. 

Jedes Verarbeitungselement fiihrt eine arithmetische Logikope- 
ration oder logische Transf ormationsoperation auf Werten 
durch, die es erhalt, bzw. fiihrt keine Operation, No-op, 
durch. Zusatzlich zur Durchfuhrung einer Operation oder einer 
No-op wird das PE mit ausgewahlten benachbarten Verarbeitungs- 
elementen verbunden. Eine dieser Verbindungen mit einem 
benachbarten Verarbeitungselement dient als KurzschluBleitung. 
Die KurzschluBverbindung ist im wesentlichen verzogerungsfrei. 
Die Verbindung findet bei Elektrizitatsgeschwindigkeit 
(Lichtgeschwindigkeit) statt, und nicht mit einer Verzogerung 
von einem Zyklus, wie dies bei gewohnlichen Operationen, 
einschlieBlich No-Op r der Fall ist. Damit konnen mehrere 
Verarbeitungselemente ubergangen werden, urn die gewiinschte 
Verbindung mit einem Verarbeitungselement herzustellen, das 
ein nicht-benachbarter Kartesischer Nachbar ist. Es kann eine 
Zickzack-Bewegung gemacht werden, um eine Verbindung mit einem 
entfernten Verarbeitungselement herzustellen, das weder in der 
gleichen Spalte noch in der gleichen Reihe ist. Obgleich die 
Feldverbindungen ohne Diagonalen sind, kann auf diese Art und 
Weise eine Verbindung zu benachbarten diagonalen oder entf ernt 
gelegenen diagonalen oder of f -diagonalen entfernten Verarbei- 
tungselementen hergestellt werden. 

Obgleich noch weitere Erklarungen folgen werden, ist an dieser 
Stelle festzuhalten, daB ein polymorphes Maschennetzwerk fur 
die Bildverarbeitung bei entsprechender Prograramsteuerung so 
konfiguriert werden kann, daB es Verarbeitungsschritte 
ausfuhrt, zu denen die komplexe Zwischenschaltung von Verar- 
beitungselementen gehort. Jedes Verarbeitungselement fiihrt 
seine entsprechende arithmetische oder logische Operation, 
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Transformationsoperation oder No-Op durch, je nachdem, welche 
Daten es erhalten hat; das Verarbeitungselement kann auch 
kurzgeschlossen werden, um ohne Zyklusverzogerung iibergangen 
werden zu konnen, 

Es stehen hochentwickelte Verbindungen und Verbindungslogiken 
als Funktion der Anzahl von Bitwerten in den Strukturregistern 
und als Funktion der Anzahl von Strukturregistern des Verbin- 
dungssteuermechanismus zur Verftigung. Diese hochentwickelten 
Verbindungen sind jedoch aufgrund der groBen Anzahl von 
Repliken, die von den zahlreichen Verarbeitungselementen 
benotigt werden , kostspielig. Um die Kosten fur die Verarbei- 
tungs element e niedrig zu halten, werden diese nicht nur am 
Geld, sondern auch an der Komplexitat und Pfadlange gemessen. 
Das bevorzugte Ausfiihrunsbeispiel weist daher auch ein 
begrenztes Repertoire von optimierten Verbindungen auf . Dieses 
Repertoire ist in den FIGUREN 4 bis 20 dargestellt. 

FIG. 4 zeigt die Bildung linearer Felder. Es ist ein lineares 
Feld 41 von West nach Ost, und ein lineares Feld 42 von Nord 
nach Siid vorhanden. In den FIGUREN 5 und 6 werden zwei 
Methoden zur Bildung von Reihenbaumen gezeigt. Bei der ersten 
Methode werden die X-Zeichenketten 45 , 46, 47 und 48 bis 51 in 
FIG. 5 gezeigt. Die X-Zeichenketten der Reihenbaume sind 
unterschiedlich lang. FIG. 6 zeigt eine herkommliche Darstel- 
lung in Form einer Baumverbindung 52. Bei dieser herkommlichen 
Baumkonfiguration f iltern 7 Eingange ein einzelnes Verarbei- 
tungselement in vier Schritten aus. 

Die FIGUREN 7-10 zeigen einen Chipbereichsvergleich und eine 
Kommunikationsentfernungsverbesserung, die sich aus der 
Verwendung von polymorphen Maschenverarbeitungselementen 
ergeben haben. Der Chipbereich des polymorphen Maschennetzes 
61 in FIG. 7 ist sehr kompakt im Vergleich zur Struktur 62 
eines orthogonalen Baums, FIG. 9. Unter Verwendung eines 
polymorphen Maschennetzes betragt die durchschnittliche 
Entfernung in einem 3x3 Fenster (FIG. 8, Struktur 63) 1,5. Das 
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gleiche 3x3 Fenster 64 in FIG. 10 hat eine durchsohnittliche 
Kommunikationsentfernung von 2,125. 

FIG, 11 ist ein Diagramm, das die Bildung von Umkehrreihenbau- 
men von polymorphen Maschenverarbeitungselementen zeigt. Diese 
Abbildung ahnelt den in FIG. 5 gezeigten Reihenbaumen. Wahrend 
ein Reihenbaum Daten von seinen Blattern sammelt, gibt ein 
Umkehrreihenbaum Daten an seine Blatter ab. 

Die FIGUREN 12-2 0 zeigen ausgewahlte Feldkonf igurationen, die 
durch programmierbare Verbindung polymorpher Maschenverarbei- 
tungselemente einfach zu bilden sind. Kinige der Verarbei- 
tungselemente in den Figuren sind als quadratische Kreisanord- 
nung dargestellt, die auf Verarbeitungsoperationen hinweisen. 
Im Gegensatz zu auftretenden Verarbeitungselementen , die fiir 
einfachen Durchlauf verwendet werden und daher als einfache 
Kreise dargestellt sind. Jedes PE kann je nach Programmierung 
Durchlauf funktionen und Verarbeitungsoperationen durchfiihren. 
Jede Struktur ist auf 16 Bitwerte reduziert und kommt voiti 
entsprechenden strukturregister . 

FIG. 21 ist "eine genaue Darstellung des bevorzugten Ausfuh- 
rungsbeispiels eines polymorphen Maschenverarbeitungselements 
entsprechend der Erfindung. Ein GroBteil des gezeigten 
Mechanismus ist standardmaBig bekannt. Diese Standard-Hardware 
wird auBerhalb des mit unterbrochenen Linien umrahmten Hastens 
93 gezeigt. Zu der Standard-Hardware gehort die ALU 96, die 
die Ausgange 1 und 2 sowie die entsprechende Eingangsmulti- 
plexe bereitstellt. Die Eingange koramen vom Bef ehlsterminal 94 
und von den Registern NSE und W 95 f die von dem Speicher 1 Ml, 
Speicher 2 M2, dem ALU-Ausgang 1 Oder Ausang 2 gespeist 
werden. Der lokale Speicher bei 101 dient fiir Berechnungen und 
Housekeeping im Zusammenhang mit der ALU. Der lokale Speicher 
101 kann zum externen Speicher erweitert werden, dessen Inhalt 
iiber eine externe Speicherdatenleitung EMD 102 zum Verarbei- 
tungselement gefiihrt wird. Der Inhalt des lokalen und externen 
Speichers wird vom Multiplexer 103 multiplexiert und mit Ml 
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oder/und M2 verbunden. Die Ausgangssignale out 1 und out 2 
werden zum gleichen Verarbeitungselement 93 zuruckgefiihrt 
sowie zu anderen vom CCM ausgewahlten Verarbeitungselementen . 

Die EMD-Verbindung und die Busse Ml und M2 sorgen fur eine 
externe Speicherdatenverbindung zu den internen Speichermit- 
teln, Verarbeitungsmitteln und dem Verbindungssteuermechanis- 
mus, wobei das Verarbeitungselement gleichzeitig mit dem 
lokalem Speicher und dem externem Speicher arbeiten kann. 

Die Verbindung bei EMD 102 ist wichtig, da sie die direkte 
Verbindung des einzelenen PE mit einem externen Speicher 
ermoglicht, der sich im Host H 3 oder in einem selbstandigen 
Speicher befinden kann, der nicht gezeigt wird. Diese EMD— 
Verbindung, die normalerweise bei einfachen Verarbeitungsele- 
menten in einem Feldprozessor nicht vorhanden ist, ermoglicht 
die Entsprechung von FIG. 3 von einem externen Speicher. Die 
EMD-Verbindung ermoglicht ebenso ein Erganzung der Hardware 
von FIG. 3 sowie eine grofce Operationsf lexibilitat und die 
Einrichtung eines polymorphen Maschennetzwerks der Verarbei- 
tungselemente . 

Die in FIG. 3 gezeigte Scha It-Capability ist uber die 
Richtungs- und Logikfunktionssteuerung mit dem externen 
Speicher und der EMD 102 verbunden. Ein breites Spektrum an 
Implemtierungsmittel fur FIG. 3 ist moglich, angefangen bei 
samt lichen in FIG. 3 gezeigten Funktionen, die sich in jedem 
Verarbeitungselement befinden, bis zu dem Fall, bei dem sich 
diese Funktionen extern von den PEs befinden, die sich 
ergebenden Bedingungen jedoch tiber die Verbindung EMD 102 zum 
einem Strukturauswahlregister Rp 99 senden. 

Die beiden Strukturregister PRO 97 und PR1 98 ermoglichen das 
verzogerungsfreie Schalten von einer Verbindungsstruktur zur 
anderen, ohne daB dabei ein Befehlszyklus verloren geht. Das 
verzogerungsfreie Umschalten wird von einem l-Bit-Register , 
dem Strukturauswahlregister (Rp 99) gesteuert. Wenn feststeht, 
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daB die Werte in einem der beiden Strukturregister nicht mehr 
langer benotigt werden, kann das Strukturregister mit einer 
neuen Struktur beladen werden. Das Beladen kann frei sein, 
d.h. gleichzeitig mit der parallelen ALU-Operation stattfin- 
den. Es darf an dieser Stelle nicht vergessen werden, daB die 
Verarbeitungselemente in Bildverarbeitungssystemen normaler- 
weise l-Bit-Verarbeitungselemente und in jedem Fall relativ 
einfach sind. Das Beladen der Struktur register 97 und 98, die 
jeweils 16 Bits aufweisen, ist relativ leistungsintensiv. Das 
Strukturauswahlregister 99 muB ebenfalls beladen werden, wobei 
es sich jedoch hierbei unci ein 1-Bit-Register handelt. 

In manchen Fallen muB die Verarbeitung eingestellt werden, um 
die Strukturregister 97 und 98 aufzuladen. Wenn dies eintritt, 
dauert die Aufladung des Strukturregister normalerweise 32 
Zyklen, wobei zudem noch ein 33. Zyklus zum Auf laden des 
Strukturauswahlregisters 99 benotigt wird. In vielen Fallen 
muB jedoch keine Zeit speziell zum Auf laden der Strukturregi- 
ster veranschlagt werden. Mit den entsprechenden Befehlen, die 
als solche bekannt sind, kann der Benutzer ein Bit in das 
Strukturregister 97 oder ein Bit in das Strukturregister 98 
oder ein Bit in das Strukturauswahlregister 99 laden. Wahrend 
des Zyklus, in dem die ALU 96 eine arithmetische und logische 
Operation iiber einen Zeitraum hinweg durchfiihrt, bei dem die 
Rechen- und Steuereinheit 96 bei voller Kapazitat arbeitet, 
konnen eines oder alle Register in den CCM geladen werden. 
Diese Freiladung erfolgt iiber einen Pfad von einem Befehl in 
der Menge 94 iiber die Multiplexer in der ALU 96 und der Ruck- 
koppelung von out 1 oder out 2, vorausgesetzt, das Befehls- 
Gate 100 ist entsprechend eingestellt, um die Ladefunktion 
auszufiihren. 

Die ausgewahlten 16 Bitwerte von den Strukturregister 97 und 
98 steuern die genaue Einstellung des 4x4 Crossbar-Schalters 
104. Siehe hierzu FIG. 2. 

Bei einer typischen Operation ist das Verarbeitungselement 
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iibernimmt ein Strukturregister wie beispielsweise Register 97, 
das eigens fur die KurzschluSverbindung vorgesehen ist, die 
Operation und fiihrt eine KurschluBverbindung iiber dieses 
Verarbeitungselement zu einem oder mehreren anderen Verarbei- 
tungselementen durch. Wenn das Verarbeitungselement aktiv ist, 
ist das Strukturauswahlregister 99 aktiv und schaltet die 
Steuerung vom Standardstrukturregister 97, das fiir das Uberge- 
hen infolge des Kurzschlusses sorgt r auf das andere Struktur- 
register 98 um, das die Ein- und Ausgange fiir die entspre- 
chende Aktivitat leitet. 

Diese Aktivitaten werden in den nachf olgenden Abschnitten 
naher erlautert. 

Das in den FIGUREN 1-3 gezeigte polymorphe Maschennetz verfiigt 
tiber eine Anzahl von Strukturen, die durch die Komplexitat 
seines Verbindungssteuermechanismus CCM begrenzt werden. Das 
CCM-Strukturrepertoire, das die Verbindung dieser Strukturen 
darstellt, eignet sicli optimal fUr die Verbindung von Berech- 
nungsarten, die separat ausgefiihrt werden. 

Fur jede Struktur ist in der Erfindung ein Steueralgorithmus 
beschrieben. Samtliche Steueralgbrithmen sind einfach zu 
implement ier en und verwenden vor allem die gleiche Hardware, 
um die gewiinschte Struktur on-line zu erzeugen. 

In der Erfindung wird ein Hardware-Mechanismus aufgezeigt, der 
die Bildung aller Strukturen auf systematische und einheitli- 
che Weise durchfuhrt. Der Mechanismus ist einfach zu implemen- 
tieren und eignet sich vor allem fur VLSI-Anwendungen. 

Eine hervorstechende Eigenschaft des polymorphen Maschennetzes 
besteht darin, da£ zahlreiche Algorithmen linearer Komplexitat 
(0(N)) auf eine logarithmische Komplexitat (O(log N) , ein 
theoretisches Optimal, reduziert werden. Die N/logN Beschleu- 
nigung wird aufgrund der neuen Architektur erzielt; fiir ein 
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Netzwerk von 1024x1024 betragt die Beschleunigung 100. 

Bei der Computer Vision wird das sich nach der ikonischen 
Verarbeitung durch eine Struktur (Masche) ergebende Bild nicht 
auBerhalb des Netzwerks gebracht. Es wird dagegegen noch 
einmal von einer anderen Struktur (z.B. Baum) verarbeitet, um 
die ikonischen Daten in symbolische Daten umzuwandeln (z.B. 
wie viele Pixel sind vorhanden, deren Werte groBer als 13 3 
sind?) . Aufgrund der polymorphen Capability mtissen die Daten 
nicht ausgegeben werden, und daher wird die I/O-Rate bedeutend 
reduziert (z.B. um fiinf GroBenordnungen fiir das Beispiel "Wie 
viele" in einem 1024x1024 Bild) . Diese I/O-Reduzierung tragt 
zur Beschleunigung aufgrund einer zusammengesetzten Berechnung 
bei. 

Eine ahdere Struktur, ein Diagonal-Span-Baum, kann vom 
polymorphen Maschennetz gebildet werden, um die Berechnung von 
Ax+By+C in Logarithmuszeit zu erleichtern, wobei A f B und C 
konstant sind und (x,y) die Koordinate eines Pixel ist. Diese 
Capability ist vor allem bei der Computergraphik und Computer 
Vision nutzlich. Bei der Computergraphik kann es vor allem fur 
die Anzeige konvexer Polygone, das Erzeugen von Schatten f 
Clipping, das Zeichnen von Kugeln, das Berechnen von adaptiver 
Histrogrammgleichstellung f der Texturabbildung und Antialia- 
sing verwendet werden. Bei der Computer Vision ist diese Funk- 
tion fur die Erzeugung von Zeilenmasken, Bandmasken und Poly- 
gonmasken niitzlich. Dariiber hinaus kann es fiir die Berechnung 
von Fast Hough Transform und seine Umkehrung zur Zeilendetek- 
tion in Rauschbildern und anderen Anwendungen eingesetzt 
werden . 

Das bevorzugte Ausfiihrungsbei spiel beinhaltet einen Hardware- 
Mechanismus, der zwolf niitzliche zellulare Automatenstrukturen 
sowie zwolf steueralgorithmen erzeugt, einen fiir jede 
Struktur, um das polymorphe Maschennetz unter Software- 
Steuerung in die entsprechende Struktur umzuwandeln. In den 
folgenden Abschnitten werden der polymorphe Hardware-Mechanis- 
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mus und die Steueralgorithmen beschrieben. 

Eine wichtige Eigenschaft des polymorphen Maschennetzes ist 
die Fahigkeit, sich selbst adaptiv an die Verarbeitungsbedin- 
gungen "anzupassen" , Wie oben bereits beschrieben konnen die 
Strukturregister 97 und 98 parallel zur ALU-Operation beladen 
werden. Daraus ergibt sich, daB jedes PE P-Strukturen 
(Pl...Pp) zur Verfiigung hat. 

Das Umbilden, das adaptiv entsprechend der der Bedingung C der 
Verarbeitung erfolgt, ermoglicht jeder PE eine Struktur Pi als 
eine Funktion C vorauszusetzen. Anfanglich starten alle PEs 
von einer Struktur aus, angenommen Pi, und die Verarbeitung 
beginnt unter der anfanglichen Struktur, Bei forts chre it ender 
Verarbeitung erfaBt jedes PE seine lokale Bedingung (dies kann 
beispielsweise eine Konvergenzprtifung des Wertes sein) und 
legt fest, ob es in der aktuellen Struktur bleibt, oder diese 
durch eine neue Struktur ersetzt. 

Eine Bedingung kann global sein, d.h. , daB der Host alle PE- 
Bedingungen zusammen erfassen kann und dann die Strukturwahl 
festlegt und an alle PEs riickkoppelt. Eine Bedingung kann auch 
lokal sein. Die neue Struktur kann zu einem einzelnen PE 
gesendet werden, oder je nach Bedarf zu einer Gruppe von PEs . 

Die Auswahl einer neuen Struktur kann auf verschiedenen Wegen 
erfolgen. 

( 1 ) vor gep lant : 

eine Strukturf olge (z.B. PI P2 ... Pp) ist geplant und wird in 
dieser Reihenfolge angenommen. Wenn der Bedarf nach einer 
neuen Struktur erfaBt wird (wahrend PI verwendet wird) , wird 
die nachste Struktur P(i + 1) verwendet. Danach wird P(i + 2) 
parallel mit der Operation in das unbenutzte Strukturregister 
geladen, sofern dies moglich ist. 
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(2) Funktion von C: 

Ein Beispiel fur die adaptive Umbildung sieht folgendermafien 
aus: 

Eine Struktur eines 3x3 Fensters wird als Pi eingesetzt, um 
eine Filteroperation durchzuf Cihren, und ein Index wird als 
Bedingung C gekennzeichnet, um die Effektivitat der Filterung 
zu messen. Dabei soli die FenstergroBe erhoht werden, wenn C 
nicht zufriedenstellend ist. In dieser Hinsicht wird P2 als 
5x5 Fenster, P3 als 7x7, P4 als 9x9 , usw. eingesetzt. 

Ein weiteres Beispiel fur die adaptive Umbildung ist die "Soft 
Fail-Anwendung" . Gewohnlich wird in jedem PE eine Bedingung C 
definiert, so daB eine Storung angezeigt wird. Diese Bedingung 
kann eingesetzt werden, um eine neue geeignete Verbindungs- 
struktur Pi festzulegen. 

POLYMORPHER MASGHENMECHANISMUS 

Das polymorphe Maschennetz (Figur 1) besteht aus einem Feld 1 
von MxM Verarbeitungselementen (PE) . Jedes PE verfiigt tiber 
vier physische Leitungen, die mit vier nicht-diagonalen 
Nachbarn kommunizieren, d.h. eine Leitung fur jeden Nachbarn. 
Diese Kommunikationsleitungen werden im Fall von PE 4 als E, 
W, S und N bezeichnet. PE 5 wird vergroBert gezeigt, um die 
Steuer- und Recheneinheit (ALU) 6, den Speicher (M) 7 und den 
Verbindungssteuermechanismus (CCM) 8 darzustellen, wobei die 
ALU 6 und der Speicher 7 standardmaBige Einrichtungen bei 
Verarbeitungselementen von Bildprozessoren sind. Der 
Verbindungssteuermechnismus ist dagegen nicht standardmaBig 
vorhanden, im Fall der Erfindung jedoch konf igurationsspezi- 
f isch. 

Aus den FIGUREN 1 und 2 geht hervor, daB jedes PE aus drei 
Funktionsblocken besteht: dem Verbindungssteuermechanismus 8, 
dem Speicherblock und dem Steuer- und Recheneinheitsblock 
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( ALU-Block) 6. Der Verbindungssteuermechanismus 8 verwendet 
die vier Leitungen (E, W, N und S) , den ALU-Ausgang und den 
Speicher (M) als Eingange und leitet sie als Ausgange zurtick. 
Das Weiterleiten erfolgt durch " SHORT-CIRCUIT ing" 
(KurzschlieBen) eines Eingangs A (beispielsweise 10 in FIG. 2) 
zu einem Ausgang B. Das auf Leitung A erscheinende Signal ist 
logisch das von Leitung B, wobei A und B beliebige Eingange 
zur Verbindungssteuereinheit sein konnen.- "SHORT-WE" 
beispielsweise stellt Leitung W 24 und Leitung E 26 logisch 
gleich. 

PIG. 3 zeigt die Funktionseinheiten von CCM 8. Die MaBnahme 
"SHORT-CIRCUIT" ist bedingt und die Bedingungen wurden von dem 
in Figur 3 gezeigten Verbindungssteuermechanismus aufgestellt. 
Jedes PE hat zwei 1-Bit-Flags Fl 31 und F2 32 zur Erzeugung 
der Bedingungssignale. Jedes PE verfugt iiber ein Schieberegi-- 
ster SRM 33, das sowohl in logischer als auch in arithmeti- 
scher Richtung verschieben kann und die wahren und komplemen- 
taren Ausgange 34 und 35 bereitstellt . 

Jedes PE ist mit einem Registerpaar X 36 und Y 37 ausgestat- 
tet, wobei X die Reihenposition der PEs (0 < X < M-l) und Y 
die Spaltenposition der PEs (0 ^ Y < M-l) enthalt. Die beiden 
Register X und Y haben jeweils ein Schieberegister SRX 38 und 
SRY 39, in die der Inhalt von X bzw. Y geladen werden kann und 
die in logischer und arithmetischer Richtung verschoben werden 
konnen. Das aus SRX verschobene Bit ist BSRX und das aus SRY 
verschobene Bit ist BSRY. 

Es sind mehrere Funktionen vorhanden, um die Bedingung herzu- 
stellen, auf der die MaBnahme "SHORT_CIRCUIT" beruht. 

LOAD reg value: mit dieser Funktion wird der "Wert" in SRM, Fl 
Oder F2 durch einen Befehl oder iiber einen Speicher geladen; 

COPYSR reg: mit dieser Funktion wird Reg X auf Reg SRX oder Y 
auf SRY oder beide kopiert. 
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AND/OR/XOR reg: mit dieser Funktion werden folgende Schritte 
durchgef uhrt : 

"AND/OR/XOR" X mit SRX und X mit SRM (oder umgekehrtem SRM); 
"AND/OR/XOR" Y mit SRY und Y mit SRM (oder umgekehrtem SRM) ; 
beide oben genannten Schritte; 

ANDALLBIT reg: mit dieser Funktion wird eine "AND-Operation" 
auf alien Bits von Reg durchgef uhrt; es wird dabei ein Bedin- 
gungsbit XANDALL erzeugt, wenn Reg gleich X ist, oder eine 
Bedingung Y ANDALL , wenn Reg gleich Y ist, oder beide Bedin- 
gungsbits. 

Die Mafcnahme " SHORT JCIRCUIT" beruht dann auf der Verbindung 
von BSRX, BSRY, XANDALL , YANDALL, Fl und F2 . 

Die beiden restlichen Funktionsblocke des polymorphen Maschen- 
netzes entsprechen dem herkommlichen Design. Der Speicherblock 
ist ein Speicher, der ein Bit zum Verbindungssteuerblock 
sendet und/oder ein Bit pro Maschinenzyklus vom Verbindungs- 
steuerblock annimmt. Obgleich die ALU dem herkommlichen Design 
entspricht, wahlt auf die "bedingte" Antwort auf die Bitver- 
bindung BSRX, BSRY r XANDALL und YANDALL eine "SEND-" oder 
"RECEIVE-MaBnahme" zusammen mit der "SHORT_CIRCUIT-MaSnahme" . 

Im Zusammenhang mit dem polymorphen Maschenmechanismus werden 
nachfolgend zwolf Strukturen beschrieben, die vom polymorphen 
Maschennetz gebildet werden. Die entsprechenden Steueralgo- 
rithmen werden der Reihenfolge nach beschrieben. 

STEUERALGORITHMEN 
(PI) Lineares Feld 

Aus Figur 4 geht hervor, daB ein lineares Reihenfeld von MxM 
Lange und ein lineares Spaltenfeld der gleichen Lange aus 
einem MxM polymorphen Maschennetz gebildet werden kann, indem 
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S von PE (M-l,i) mit N von PE (0,i-KL) und E von PE (i, M-l) 
mit W von PE (i+1,0) verbunden wird. N von PE (0,0) und S von 
PE (M-l, M-l) bilden den Anfang bzw. das Ende des linearen 
Spaltenf eldes , wahrend W von PE (0,0) und E von PE (M-l, M-l) 
den Anfang bzw. das Ende des linearen Reihenf eldes bilden. 

Der Steueralgorithmus sieht folgendermaBen aus: Pro PE-Zylus, 

LINEAR () 
{ 

MEM - W;/*MaBnahme 1*/ 
E = MEM;/*MaBnahme 2*/ 
MEM = N;/*MaBnahrae 3*/ 
S » MEM;/*MaBnahme 4*/ 

} 

MaBnahme (1) setzt die Dateneinheit auf W in MEM am Ende des 
Zyklus, wahrend MaBnahme (2) den Inhalt von MEM (am Anfang des 
Zyklus) auf E setzt. Zusammen erzeugen die MaBnahmen (1) und 

(2) das Reihenf eld. Die durch W von PE (0,0) eingespeisten 
Daten verlaufen in ostlicher Richtung, und nach M Zyklen ist 
die erste Reihe gefiillt. Nach weiteren M Zyklen gehen die 
Daten in der ersten Reihe in die zweite Reihe, wfihrend die 
neuen Daten in die erste Reihe eingefiigt werden. Die MaBnahmen 

(3) und (4) sorgen auf Mhnliche Art und Weise fur ein lineares 
Spaltenf eld. 

Die Bildung des linearen Feldes ist nicht bedingt. Alle PEs 
fiihren die gleichen MaBnahmen durch. Der Mechanismus im 
Verbindungssteuermechanismus wird nicht verwendet. 

(P2) Reihenbaum 

Mit Hilfe des folgenden Steueralgorithmus konnen M Baume 
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(einer pro Reihe) von dem polymorphen Maschennetz gebildet 
werden - 

ROW-TREE () 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidO;/*Spaltenposition eines PE, IDO verarbeiten*/ 
int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int treemask~l;/*ein Flag zur Bildung des Baums*/ 

for (t=0;t<logM;t++) { 
if (-treemask) 

{ SHORTJffE ; DISABLE ; } 
if (treemask && -pidO<t>) 

E - MEM; 
if (treemask && pidO<l>) 

MEM = W; 
treemask = treemask & pidO<t>; 

} 

} 

Figur 5 zeigt den oben dargestellten Steueralgorithmus fur den 
Fall eines 8-PE. Bei t=0 sind die "treemasks" (Baummasken) fiir 
alle PEs 1, daher wird jedes PE aktiviert und die "geraden 
PEs" senden Daten zu den "ungeraden PEs". Dies wird durch 
einen Pfeil zwischen jedem Paar von "ungeraden/geraden" PEs 
angezeigt. Dadureh wird auch die unterste Stufe des Baums 
gebildet. 

Bei t=l werden durch Untersuchung der Baummaske nur die PEs 
mit pidO<0>=l (niedrigstes Bit von pidO) aktiviert. Die nicht 
aktivierten PEs werden nicht im Kreis gezeigt, sie stellen 
jedoch die Verbindung zwischen PE 1 und 3 sowie PE 5 und 7 
durch die MaBnahme SHORT WE her. Dadureh wird die zweite Stufe 
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des Baums gebildet. 

Die hochste Stufe des Baums wird durch die Steuerung bei t=2 
gebildet. An dieser Stelle werden nur PE 3 und PE 7 aktiviert; 
die restlichen PEs stellen die Verbindung durch "SHORT" des W- 
E-Pfades her, fiihren jedoch keine Operation durch (oder andern 
nicht den Status von MEM) • 

* 

* 

Eine andere Darstellung dieses Steueralgorithmus erscheint in 
Figur 6, wo die Knoten von jeder Baumstufe von der Prozessor- 
identifikation (pid) der PEs markiert werden. 

Die Baumstruktur ist vor allem fur ein Teile-und-Herrsche- 
Paradigma nutzlich. Dedizierte Baummaschinen wurden fur 
spezielle Berechnungen gebaut. Die Komplexitat der Algorithmen 
in diesem Paradigma ist gewohnlich 0(log N) , wobei N die GroBe 
der Eingangsdaten ist. Der gleiche Algorithmus braucht O(N) 
Ausfiihrungszeit in einem Maschennetz; dies ist eine 1024:10 
Beschleunigung fiir N=a024. Zu den wichtige Algorithmen in 
dieser Kategorie gehoren MAX, MIN, k-te grofcter, mittlerer, 
einige/keine usw. 

Wenn der Mechanismus im Verbindungssteuerblock verwendet wird, 
benutzt der Steueralgorithmus das Register X fiir pidO, das 
Register SRX und das Flag Fl fur die "Baummaske". Der Inhalt 
des X-Registers wird in SRX kopiert, so daB das pid<t>-Bit bei 
Zeitschritt 1 in BSRX verschoben und dann in einer AND-Opera- 
tion mit der "Baummaske" verbunden wird, urn die Endbedingung 
abzuleiten. 

( P3 ) Spaltenbaum 

Ahnlich wie bei Reihenbaumen konnen M Spaltenbaume vom 
polymorphen Maschennetz gebildet werden, wobei die Reihenposi- 
tion der PEs, pid 1, die Steuerung ist, und N-S Pfad die 
Verbindung. Der Steueralgorithmus sieht f olgendermaBen aus: 
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COIiUMN—TREE () 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidl;/*Reihenposition eines PE*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int treemask-l;/*ein Flag zur Bildung des Baums*/ 

for(t=0;t<logM;t++) { 

if (-treemask) 

{ SHORTENS ; DISABLE ; } 
if (treemask && -pidl<t>) 

S « MEM; 
if (treemask && pidO<t>) 

MEM « N; 
treemask = treemask & pid0<t>7 

} 

} 

Spaltenbaume konnen verwendet werden, urn Daten, die spa It en - 
weise im Maschennetz verteilt sind, zu iibertragen und 
Algorithmen mit linearer Komplexitat (O(N)) wie im Abschnitt 
mit den Reihenbaumen beschrieben* in Algorithmen mit logarith- 
mischer Komplexitat (O(log N) ) umzuwandeln. 

Ahnlich wie der ROW JTREE-Steuera Igor ithmus verwendet der 
COIiUMN_TREE-Steueralgorithmus das Register Y fiir pidl, SRY zum 
Kopieren von Y und F2 fiir die "Baummaske" . Die Bedingung fiir 
SHORTENS beruht auf einer AND-Operation von F2 und BSRY, aus 
der pidl<t> beim Zeitschritt t hervorgeht. 

(P4) Orthogonaler Baum 

Ein orthogonaler Baum (FIG. 9) ist ein niitzliches Netzwerk zum 
Sortieren f fiir Matrixoperationen, minimal spannender Baum, FFT 
und andere Graphalgorithmen. Der Baum kann vom polymorphen 
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Maschennetz mit Hilfe des untenstehenden ORTH_JTRE E — Steuer a lg o — 
rithmus durch Verbinden der Reihen- und Spaltenbaume gebildet 
werden • 

ORTHJTREE () 
{ 

int t;/*t ist der Zeitschritt*/ 

int. pidO;/*Spaltenposition eines PE, IDO verarbeiten*/ 
int pidl;/*Reihenposition eines PE*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM—log M*/ 

int hmask=l, vmask=l; /*Flags zur Bildung des Baums*/ 

for (t~0;t<logM,t++) { 

/*Zyklus 1*/ 

if (-hmask) 

{ SHORTJ7E ; DISABLE ; } 

if (hmask && -pidO<t>) 

E = MEM; 
if (hmask && pidO<t>) 

MEM = W; 
hmask - hmask & pidO<t>; 

/*Zyklus 2*/ 

if (-vmask) 

{ SHORTENS ; DISABLE ; } 
if (vmask && -pidl<t>) 

S = MEM; 
if (vmask && pidl<t>) 

MEM = N; 
vmask = vmask & pidl<t>; 

} 

> 

Die Hauptvorteile eines orthogonalen Baums von einem polymor- 
phen Maschennetz liegen (1) bei der Reduzierung des Chipbe- 
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reichs: der Chipbereich, der fur das Maschennetz und den 
orthogonalen Baum benotigt wird, ist 0(N**2) bzw* 
0( (N**2) *(log N)**2), wobei N die SeitengroBe des Maschennet- 
zes und die Anzahl der Blatter des orthogonalen Baums 
darstellt. Dadurch wird eine Einsparung vora Faktor (log N) **2 
erzielt. Bei N=1024 betragt der vom polymorphen Maschennetz 
beanspruchte Chipbereich 1/100 des orthogonalen Baums. 

(2) effiziente Nachbarschaftsoperationen: PEs in orthogonalen 
Baumen sind wegen der Bildverarbeitung nicht mit ihren geogra- 
phisch nachstgelegenen Nachbarn verbunden. Viele wichtige 
Nachbarschaftsoperationen konnen nicht effizient durchgefiihrt 
werden, weil keine direkten Kommunikationspf ade vorhanden 
sind. Mehr als die Halfte aller Daten in einem 3x3 Fenster 
miissen eine Stufe nach oben im Baum gebracht werden, bevor sie 
zur Mitte des Fensters gehen. Die durchschnittliche Entfernung 
zwischen Daten in einem 3x3 Fenster betragt 2,125 gegeniiber 
1,5 in einem polymorphen Maschennetz. In den Figuren 8 und 10 
ist ein Beispiel eines 3x3 Fensters fiir den orthogonalen Baum 
dargestellt, wobei die Zahl im Kreis die Entfernung zwischen 
der Dateneinheit und der Fenstermitte angibt, 

Wie in Figur 7 fiir N=4 zusammengef a£t ist, betragt das 
Verhaltnis des Chipbereichs zwischen dem polymorphen Maschen- 
netz und dem orthogonalen Baum 16:46 und das Verhaltnis der 
durchschnittlichen Entfernung in einem 3x3 Fenster 1,5:2,1 
(Figur 8 und 10) . 

Der Steueralgorithmus ORTHJTREE verwendet das Register X fiir 
pidO, SRX zur Kopie von pidO, Fl fiir hmask und erzeugt pid0<t> 
beim Zeitschritt t in BSRX. Der zweite Steueralgorithmus 
verwendet das Register Y fur pidl, SRY zur Kopie von pidl, F2 
fiir vmask und erzeugt pidl<t> beim Zeitschritt t in BSRY. Die 
bedingten SHORT_WE und SHORTENS beruhen auf BSRX, BSRY, Fl und 
F2. 

(P5) Umkehrreihenbaum 
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Der RR-Baum ist ein Top-Down-Baum (im Gegensatz zu Baumen, die 
Bottom-Up sind) , der von der oberen Ebene zur unteren Ebene 
des Baums gebildet werden kann, d.h. ein UmkehrprozeB eines 
Reihenbaums. Der Steueralgorithmus ist nachfolgend darge- 
stellt . 

RR— TREE () 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidO;/*Spaltenposition eines PE*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int treemask=M%2;/*ein Flag zur Bildung des Baums*/ 
int mask;/*eine Zwischenbedingung*/ 

for (t=0;t<logM;t-M-) { 

mask - ANDALLBIT (-treemask | pidO) ; 
if (-mask) 

{ SHORT__WE ; DI SABLE ; } 

if (mask && pidO<logM-t-l>) 

W = MEM; 
if (mask && -pidO<logM-t-l>) 

MEM « E; 
treemask = ASHIFT (treemask, 1) ; 

> 

} 

Anhand eines 8-PEHBeispiels in Figur 11 kann der Steueralgo- 
rithmus wie folgt beschrieben werden. Die Flag-Baummaske wurde 
als eine Halfte der Gesamtanzahl von PEs initialisiert (z.B. 4 
= 100) . Die UMGEKEHRTE "Baummaske" wird mit pidO einer OR- 
Operation unterzogen und das Ergebnis wird zu ANDALLBIT 
weitergeleitet, das eine «l f in die 'Maske 1 bringt, wenn alle 
Bits des Ergebnisses •l 1 sind, andernfalls wird eine *0 % 
gebracht. Die PEs in der Maske=l (z.B. PE 3 und 7) sind Teil 
des Baums. Der Rest, der keinen Baumknoten darstellt, deakti- 
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viert sich selbst und schlieBt (SHORT) seinen W-E-Pfad kurz, 
im die Baumverbindung herzustellen. Bei PE 3 und 7 wird das 
Bit 2 von pidO weiter gepriift, eine , l l in diesem Bit veran- 
la£t PE 7 die Dateneinheit zum Empf anger PE 3 zu schicken, 
dessen Bit 2 • 0 f ist. Dadurch wird die obere Ebene des Baums 
bei t=0 gebildet. 

Am Ende von t=0 wird die Baummaske arithmetisch um ein Bit 
nach rechts verschoben. Es wird zu 110 fur den nachsten 
Zeitschritt. 

Bei t=l stellt der gleiche ProzeB fest, daB PE 1, 3 r 5 und 7 
Baumknoten sind, und daB PE 7 Daten zu PE 5 und PE 3 Daten zu 
PE 1 sendet. Am Ende von t=l wird die Baummaske zu ill. 

Bei t=2 ist jedes PE ein Baumknoten und jedes PE mit ungeradem 
pidO sendet Daten zu seinem Nachbarn mit niedrigerem geraden 
pidO. 

Unter Verwendung des Mechanismus im Verbindungssteuerblock 
wird die "Baummaske" in SRM geladen und X auf SRX kopiert. Das 
Register X wird zuerst einer "OR-Operation" mit dem 
UMGEKEHRTEN SRM unter zogen; das Ergebnis wird einer 
"ANDAIjLBIT— Operation" unter zogen, um die "Maske" zu erzeugen. 
SRX wird logisch nach links verschoben f um pidO<logM-t-l> in 
BSRX beim Zeitschritt t zu erzeugen. Dies wird dazu verwendet, 
die SEND/RECEIVE-MaBnahme fur ein Paar von Baumknoten zu 
steuern . 

Der RR-Baum wird hauptsachlich zur Weiterleitung einer 
Dateneinheit zu alien Baumknoten verwendet, die je nach 
Position im Baum unter schiedliche Operationen auf dieser 
Dateneinheit dur chf iihren . Fur Anwendungen im Computer graph ik- 
bereich ist diese Struktur besonders niitzlich, da damit jedes 
PE A*X gleichzeitig erzeugen kann, wobei A eine Konstante und 
X pidO ist. Die parallele Berechnung von A*X ermoglicht die 
schnelle Erzeugung einer Zeile. Darauf wird noch naher bei 
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einer anderen Struktur, dera sogenannten Diagonal-Span-Tree 
( P 1 2 ) e ingegangen . 

Allgemein wird ein Umkehrbaum dazu verwendet, eine symbolische 
Darstellung in einem Parameterbereich in eine ikonische 
Darstellung in einem Bildbereich umzuwandeln. Der Algorithmus 
wird dann ikonisch in einer Parallelitat ausgef uhrt , die im 
polymorphen Maschennetz zur Verfiigung steht. 

Obgleich der steuer algorithmus das PE mit dem ftochsten pido 
als Wurzel des Baums verwendet, kann auch das PE mit dem 
niedrigsten pidO als Wurzel verwendet werden, wobei der 
Steueralgorithmus die gleiche Komplexitat aufweist:. 

(P6) Umkehrspaltenbaume (RC-Baum) 

Ahnlich wie beim RR-Baum kann der RC-Baum mit: Hilfe von pidl 
als Steuerung und N-S als Pfad zur Herstellung einer Baumver- 
bindung verwendet werden. Dies geht aus dem folgendem Steuer- 
algoritbmus hervor. 

RC— TREE () 
{ 

int *t;/*t ist der Zeitschritt*/ 

int pidl;/*Reihenposition eines PE*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int treemask==M%2;/*ein Flag zur Bildung des Baums*/ 
int mask;/*eine Zwischenbedingung*/ 

for (t=0;t<logM;"t-M-) { 

mask = ANDALLBIT (-treemask | pidl) ; 
if (—mask) 

{ SHORTENS ; DI SABLE ; } 
if (mask && pidl<logM-t-l>) 

N = MEM; 
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if (mask && -pidl<logM-t-l>) 

MEM = S; 
treemask = ASHIFT (treemask,!); 

} 

} 

Die Eigenschaften der RC-Baume sind die gleichen wie bei den 
RR-Baumen, mit Ausnahme davon, da/3 sich die RC-Baume auf die 
Daten in der Spalte des Maschennetzes beziehen. 

(P7) Reihenbus 

Fur Rundspruchzwecke ist vor allem ein Bus eine sehr niitzliche 
struktur, dessen Rundspruchentfernung die kleinste ist. Fur 
jede Reihe des polymorphen Maschennetzes kann mit Hilfe des 
folgenden Steueralgorithmus ein Bus gebildet werden. 

ROW_BUS () 
{ 

int sender; /*XD fur den Sender*/ 
int pidO ; 

SHORT__WE ; 

if (pidO — sender) 
E « MEM; 

else 

MEM - W; 

} 

Ein PE in der Reihe wird als "Sender" bezeichnet, wahrend die 
iibrigen PEs Empf anger sind. Alle PEs schlieBen ("SHORT") ihren 
E-w-Pfad kurz, urn den Bus herzustellen. Der Sender sendet die 
Daten zu E (oder W) , wahrend die Empf anger die Daten von W 
(oder E) empfangen konnen. (Wenn in einem anderen Fall eine 
Dateneinheit von einem externen Controller zu W oder E gefiihrt 
wird, ist kein "Sender" vorhanden und alle PEs sind 
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"Empf anger") • 

Uirter Verwendung des Mechanismus im Verbindungssteuerblock 
wird der "Sender" in SRM geladen. Das "UMGEKEHRTE" SRM wird in 
einer "XOR-Operation" mit Register X verbunden, das pidO 
speichert. Die sich ergebenden Bits werden einer "ANDALLBIT- 
Operation" unterzogen. Eine "l 1 in XANDALL legt das PE als 
Sender fest; die PEs mit XANDALL=0 sind die Empf anger. 

(P8) Spaltenbus 

Ahnlich wie beim Reihenbus kann fur jede Spalte des polymor- 
phen Maschennetzes ein Spaltenbus gebildet werden, indem 
entsprechend dem folgenden Steueralgorithmus pidl als 
Steuerung und N-S als Pfad verwendet wird. 

COLUMNJ3US () 
{ 

int sender; /*ID ftxr den Sender*/ 
int pidl; 

SHORTENS ; 

if (pidl = ■ sender) 
S = MEM; 

else 

MEM = N; 

} 

Die Eigenschaften des Spaltenbusses sind die gleichen wie beim 
Reihenbus . 

Zusammen konnen der Reihenbus und der Spaltenbus verwendet 
werden, urn eine gemeinsame Dateneinheit an alle PEs in einem 
Maschennetz in zwei Schritten weiterzuleiten. In einem ersten 
Schritt kann die allgemeine Dateneinheit an alle PEs in der 
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ofoeren Reihe weitergeleitet werden; im zweiten Schritt kann 
das PE in der oberen Reihe die allgemeine Dateneinheit an alle 
anderen PEs in Spaltenrichtung weiterleiten. 

(P9) Pyr amide 

Eine Pyramidenkonf iguration eignet sich vor allem bei der 
Bildverarbeitung und Computer Vision, da damit Mehrf achauf 16- 
sungsbilder verarbeiten werden konnen. Diese Struktur kann 
mittels des folgenden Steueralgorithmus vom Maschennetz gebil- 
det werden: 

PYRAMID ( ) 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidO;/*Spaltenposition eines PE*/ 

int pidl ; /*Reihenposition*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int hmask^l, vmask=l;/*2 Flags zur Bildung der Pyramide*/ 

for(t=0;t<logM;t++) { 
/*Zyklus 1 MaBnahme*/ 

if (-'mask | -^vmask) 

{ SHORTJffE ; SHORTENS ; DISABLE ; > 

if (hmask && vmask && -pidO<t> && -pidl<t>) 
E = MEM; 

if (hmask && vmask && pidO<t> && -pidl<t>) 

{N = MEM; MEM1 = W;} 
if (hmask && vmask && -pidO<t> && pidl<t>) 

E = MEM; 

if (hmask && vmask && pidO<t> && pidl<t>) 
{MEMO = N; MEM2 = W; } 

/*Zyklus 2 MaBnahme*/ 

if (-^mask | -»vmask) 

{ SHORT WE ; SHORTENS ; DISABLE ; } 
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if (hmask && vraask && -pidO<t> && -pid<t>) 
NONACTION ; 

if (hmask && vmask && pidO<t> && -pidl<t>) 
S - MEMl; 

if (hmask && vmask && -pidO<t> && pidl<t>) 
NONACTION; 

if (hmask && vmask pidO<t> && pidl<t>) 
MEMl = N; 

hmask = hmask & pidO<t>; 
vmask « vmask & pidl<t>; 

} 

} 

Der Steueralgorithmus besteht aus log M Schritten und in jedem 
Schritt sind zwei Steuerzyklen. Mit anderen Worten heiBt dies, 
da£ jeder Schritt eine Stufe der Pyramide in zwei PE-Zyklen 
bildet. 

Die Figuren 12, 13 und 14 zeigen einen Steueralgorithmus fur 
eine Pyramide in einem 8x8 Maschennetz. Die beiden Masken 
hmask (fur Reihe) und vmask (fur Spalte) werden als 1 1» 
initialisiert, so da& alle PEs im Maschennetz beim ersten 
Zeitschritt "aktiviert" werden. Bei t=0 sind alle PEs aktiv 
und jeweils 2x2 PEs bilden eine Gruppe. Diese vier (2x2) PEs 
sind die NW-, NE-, SW- und SE-S6hne der Pyramide und der Vater 
ist der gleiche wie der SE-Sohn. Die Aktivitaten der vier 
Sohne werden durch die Bits von pidO<l> und pidl<l> unter- 
schieden. Der SE-Sohn (oder der Vater) , der als 
pidO<0>*=pidl<0>=l gekennzeichnet ist, empfangt Daten von den 
Sohnen SW (pidO<0>=0 und pidl<0>=l) und NE (pidO<0>=! und 
pidl<0>=0) im ersten Zyklus. In diesem Zyklus leitet der NW- 
Sohn seine Daten zum NE-Sohn weiter; diese Daten werden dann 
vom Vater im zweiten Zyklus empfangen. Im zweiten Zyklus sind 
nur der NE~Sohn und der Vater vom Senden und Empfangen betrof- 
fen; die anderen beiden PEs sind inaktiv. Sowohl vmask und 
hmask werden aktualisiert, urn die Verbindung des nachsten 
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Zeitschritts zu steuern. 

Bei t=l bilden vier PEs vier Sohne und einen Vater ftir die 
nachste Stufe der Pyramide. Diese vier PEs befinden sich wie 
in Figur 13 gezeigt in einem 4x4 Maschennetz . Die Aktivitat 
der vier Sohne und des Vaters ist die gleiche wie bei t=0, mit 
der Ausnahrae, daB die PEs in den geraden Reihen oder Spalten 
deaktiviert sind. Diese deaktivierten "nicht in der Pyramide 
befindlichen" PEs schlieBen (SHORT) ihr W zur E-Leitung und N 
zur S-Leitung kurz, urn die Pyramidenverbindung herzustellen. 

Die PEs, die die letzte Stufe der Pyramide bilden, werden in 
Figur 14 gezeigt. Ihre Aktivitaten sind die gleichen wie bei 
den beiden vorangegangenen Schritten. 

Orthogonal zu der oben beschriebenen Pyramidenstruktur hat die 
Pyramidenstruktur eine Maschenverbindung auf jeder Stufe, Fur 
jeden Knoten in der Pyramide sind vier Nachbarn (N r S f B, W) 
auf der gleichen Stufe vorhanden, im Gegensatz zu vier Sohnen 
auf der Stufe darunter und einem Vater auf der Stufe dariiber. 
Dieses Verhaltnis wird in Figur 15 gezeigt. 

Der Steueralgorithmus fttr die Nachbarn auf der gleichen Stufe 
ist im Steueralgorithmus der obeh beschriebenen Pyramide inte- 
griert. Bei t=0 (Figur 8a) werden die Nachbarn der gleichen 
Stufe beispielsweise vom urspriinglichen Maschennetz verbunden. 
Bei t=l sind die Nachbarn der gleichen Stufe in jeder zweiten 
Reihe und Spalte verteilt, und die Maschenverbindung wurde 
durch den oben erwahnten steueralgorithmus PYRAMID herge- 
stellt. • 

Urn den Inhalt der Nachbarn auf der gleichen Stufe der Pyramide 
zu erhalten, werden zwei Steuerzyklen zu jedem Schritt des 
Steueralgorithmus PYRAMID wie folgt hinzugefugt. In Zyklus 3 
ist der Inhalt von N vorhanden, und in Zyklus 4 der Inhalt von 
S und E. 
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PYRAMID () 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidO:/*Spaltenposition eines PE*/ 

int pidl:/*Reihenposition*/ 

int M, logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int hmask=l, vmask=l;/*2 Flags zur Bildung der Pyramide*/ 

for(t==0;t<logM;t-M-) { 
/*Zyklus 1 MaBnahme*/ 

if (-hmask | -vmask) 

{ SHORTJfE ; SHORTENS ; DISABLE ; } 

if (hmask && vmask && -pidO<t> && -pidl<t>) 
E = MEM; 

if (hmask && vmask && pidO<t> && -pidl<t>) 

{N = MEM; MEM1 = W;} 
if (hmask && vmask -pidO<t> && pidl<t>) 

E = MEM; 

if (hmask && vmask && pidO<t> && pidl<t>) 
{MEMO - N; MEM2 « W;} 

# 

/*Zyklus 2 MaBnahme*/ 

if ( -hmask | -vmask) 

{ SHORTJfE ; SHORTENS ; DISABLE ; } 
if (hmask && vmask && -pidO<t> && -pidl<t>) 
NONACTION; 

if (hmask vmask && pidO<t> && -pidl<t>) 
S = MEM1; 

if (hmask && vmask && -pidO<t> && pidl<t>) 
NONACTION ; 

if (hmask && vmask && pidO<t> && pidl<t>) 
MEM1 = N; 

/*Zyklus 3 MaBnahme*/ 

if (-'hmask | --vmask) 
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{ SHORT_WE ; SHORTENS ; DISABLE ; } 

if (hmask && vmask) { 
S = MEM 3 ; 
E = MEM4; 
MEM3 = N; 
MEM4 - W; 

} 

« 

/*Zyklus 4 MaBnahme*/ 

i f ( -hmask | -»vmask } 

{ SHORTJtfE ; SHORTENS ; DISABLE ; } 
if (hmask && vmask) { 
N = MEMS; 
W = MEM6; 
MEMS » S; 
MEM6 = E; 

} 

hmask - hmask & pid0<t>; 
vmask — vmask & pidl<t>; 

} 

Unter Verwendung des Mechanismus im Verbindungssteuerblock 
werden hmask und vmask in Fl hzw. F2 geladen. pidO in Register 
X und pidl in Register Y werden in SRX bzw. SRY kopiert. Bei 
der logischen Verschiebung nach rechts enthalten BSRX und BSRY 
pid0<t> und pidl<t> bei Zeitschritt 1. Diese beiden 
Bedingungsbits werden zusammen mit Fl und F2 verwendet, urn die 
SHORT-MaBnahmen zu implement ieren. 

Die oben beschriebene Pyramide hat eine Basis von MxM und eine 
Schrumpfung von 2, d.h., da£ die Stufe uber der Basis M/2 x 
M/2 PEs hat, und so weiter. Der Steueralgorithmus PYRAMID kann 
erweitert werden, so daB er eine beliebige Schrumpfung K bear- 
beiten kann, wobei K eine Potenz von 2 ist, und hmask und 
vmask durch hmask = hmask & pid0<t> & pidO<t+l> sowie vmask = 
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vmask & pidl<t> & pidl<t-fl> aktualisiert wird. Zusatzlich 
werden die MaBnahmen der Pyramidenknoten bei dem ungeraden t- 
Schritt liber sprungen . 

(P10) Umkehrpyramide 

Die Daten flieBen von unten nach oben in einer Pyramide, urn 
eine Umwandlung von ikonisch zu symbolisch durchzuf iihren . Fur 
eine Umwandlung von symbolisch zu ikonisch miissen die Daten in 
der entgegengesetzten Richtung flieBen. Dies wird durch die 
Umkehrpyramide (R-Pyramide) , die aus einem polymorphen 
Maschennetz gebildet wird, anhand des folgenden Steueralgo- 
rithmus erreicht. 

R— PYRAMID () 
{ 

int t;/*t ist der Zeitschritt*/ 

int pidO;/*Reihenposition eines PE*/ 

int. pidl;/*Spaltenposition eines PE*/ 

int M,logM;/*M ist die Seitengr6Be des Maschennetzes und 
logMNlog M*/ 

int mask=M%2;/*Flag zur Bildung der Pyramide*/ 
int hmask, vmask; 

for ( t=0 ; t<logM ; t-f +) { 

hmask - ANDALLBIT (-mask | pidO) ; 
vmask = ANDALI.BIT (-mask | pidl) ; 

/*Zyklus 1*/ 

if (-mask | -vmask) 

{ SHORTJfE ; SHORTENS ; DISABLE ; } 
if (hmask && vmask && pidO<logM-t-l> && pidl<logM-t- 

N = MEM2; 

if (hmask && vmask && pidO<logM-t-l> && -pidl<logM-t- 

1>) 
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MEM2 = S; 

if (hmask && vmask && -.pidO<logM-t--l> && pidl <logM« 

t-l>) 

NONACTION; 

if (hmask && vmask -pidO<logM-t-l> && -pidKlogM- 

t-l>) 

NO ACTION; 



/*Zyklus 2*/ 

if(Hhmask | -vmask) 

{ SHORTJffE ; SHORTENS ; DISABLE ; > 

if (hmask && vmask && pidO<logM-t-l> && pidl<logM-t- 

1>) 

{N = MEM1; W = MEM3 ; } 
if (hmask && vmask && pidO<logM-t-l> && -pidl<logM-t- 

1>) 

{MEM1 - S; W « MEM2 ; > 
if (hmask && vmask && -pidO<logM-t-l> && pidl<logM-t- 

i) 

MEM3 - E ; 

if (hmask && vmask && -<pidO<logM-t-l> && -pidKlogM- 

t-l>) 

MEM2 = E; 
mask « ASHIFT (mask,!) ; 

> 

} 

Der Steueralgorithmus fur die R_PYRAMID ist ein UmkehrprozeB 
des steueralgorithmus PYRAMID und eine Erweiterung von RRJDREE 
und RC_TREE. 

Eine Halfte der MaschennetzgroBe (die "Maske") wird in 
Register SRM geladen, wahrend pido in X und pidl in Y auf SRX 
bzw. SRY kopiert werden. Das "UMGEKEHRTE" SRM wird in einer 
"OR-Operation" mit X verbunden, und dann einer "ANDALLBIT- 
Operation" unterzogen, urn das Flag "hmask" in XANDALL zu 
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foilden. Auf ahnliche Art und Weise wird "vmask" in YANDALL 
erzeugt. Zusammen mit diesen beiden Bedingungsbits werden pidO 
und pidl logisch von links nach rechts verschoben, um 
pidO<logM-t-l> und pidl<logM-t-l> bei Zeitschritt t in BSRX 
bzw. BSRY zu bilden. In den Figuren 16 , 17 und 18 ist die 
Bildung einer Pyraiaide in einer 8x8 polymorphen Pyramide 
dargestellt . 

* 

Genau wie bei PYRAMID besteht jeder Schritt des Steueralgo- 
rithmus R-PYRAMID aus zwei Zyklen: der erste Zyklus ist eine 
Zwischenstufe beim Senden von Daten zum NW-Sohn (Daten werden 
in diesem Zyklus zum NE-Sohn weitergeleitet, wahrend sie im 
zweiten Zyklus zum NW-Sohn weitergeleitet werden) ; wahrend im 
zweiten Zyklus der NE-Sohn Daten zum NW-Sohn weiterleitet, 
sendet der Vater gleichzeitig Daten zu den NE- und SW-Sohnen. 

Die Verbindung fur die Nachbarn auf der gleichen Stufe der 
Pyramide konnen ahnlich wie bei PYRAMID auch beim Steueralgo- 
rithmus R-PYRAMID hergestellt werden. Fur den DatenfluB von 
oben nach unten wird im allgemeinen jedoch keine Kommunikati- 
onsverbindung auf der gleichen Stufe hergestellt. Bei Bedarf 
konnen ahnliche MaBnahmen wie bei den Zyklen 3 und 4 des 
Steueralgorithmus PYRAMID verwendet werden. 

Die oben beschriebene Pyramide hat eine Basis von MxM und eine 
Schrumpfung von 2, d.h., daB die Stufe uber der Basis M/2 x 
M/2 PEs hat f und so weiter. Der Steueralgorithmus R-PYRAMID 
kann erweitert werden, so daB er eine beliebige Schrumpfung K 
bearbeiten kann, wobei K eine Potenz von 2 ist und SRM durch 
M/(logK) initialisiert und SRM log K-Bits pro Schritt verscho- 
ben wird. 

(Pll) Wurfel 

Ein Wurfel ist die normale Erweiterung des polymorphen 
Maschennetzes zu einer 3D-Struktur. Die Anwendung eines 
Wurfels einer 3D-Datenstruktur {z.B. 3D-Bildelement « Volumen 
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» Voxel) kann analog zur Anwendung des Maschennetzes einer 2D- 
Datenstruktur (z.B. 2D-Bildelement = Bereich » Pixel) 
beschrieben werden. 

Um einen Wurfel im Maschennetz zu bilden, wird die Datenstruk- 
tur in der dritten Dimension vertikal aufgeteilt und einem PE 
zugeordnet, so daB die Kommunikation in der dritten Dimension 
durch die lokale Speicherkommunikation durchgefiihrt werden 
kann, wahrend die Kommunikation im Zusammenhang mit den beiden 
anderen Dimensionen uber das Maschennetz lauft. Die polymorphe 
Funktion wird bei der Bildung dieser Struktur nicht verwendet, 
und die Wiirf elbildung ist daher nicht so neuartig wie die 
anderen elf Strukturen. Die Wiirf elstruktur wird jedoch vom 
polymorphen Maschennetz unterstiitzt, wobei in der dritten 
Dimension die Verbindungspins nicht benotigt werden. Da die 
Einsparung der Pins ins Gewicht fallt (2xMxM Pins insgesamt) , 
ist die Bildung eines Wtirfels von einem polymorphen Maschen- 
netz wichtig fiir VLSI-Implementierungen. 

Durch das Daten-Slicing kann ein MxMxK-Wiirfel gebildet werden, 
wobei K eine ganze Zahl ist, und der Wert von K nur durch den 
Umfang des lokalen Speichers im PE begrenzt ist. 

(P12) Diagonal-Span-Tree (DST) 

Ein Diagonal-Span-Tree (DST) ist ein binarer Baum, dessen 
Blatter die Diagonale des Maschennetzes nur einmal umspannen. 
Nach dieser Definition hat der DST in einem NxN Maschennetz N 
Blatter, die jeweils einen diagonalen Knoten besetzen, der als 
PE (k, N-l-k) , k=0 bis N-l gekennzeichnet ist. In einem 
Maschennetz sind viele DST moglich. Es wurde ein in Figur 19 
gezeigter DST ausgewahlt (dargestellt durch einen dreistufigen 
DST in einem 8x8 Maschennetz) , da dieser einfach zu kontrol- 
lieren ist. 

Aus Figur 19 geht hervor, daB die Wurzel des DST bei PE(0,0) 
(obere linke Ecke des Maschennetzes) ist. Der linke Sohn der 
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Wurzel ist vertikal vier Einheiten entfernt (z.B. PE(4,0)), 
wahrend der rechte Sohn horizontal vier Einheiten entfernt ist 
(z.B. PE(0,4)). 

Die Sohne der zweiten Stufe sind von den entsprechenden Sohnen 
der ersten Stufe vertikal und horizontal zwei Einheiten 
entfernt. Daher sind PE(6,0) und PE(2,4) die Sohne von 
PE(0,4), wahrend PE(4 f 2) und PE(6,0) die Sohne von PE(4,0) 
sind. 

Bei der Erweiterung auf ahnliche Art und Weise sind alle dia- 
gonalen PEs des Maschennetzes die Sohne der dritten Stufe. 

Allgemein definiert lafit sich sagen, daB einen Upper Left DST 
(oben links DST, ULDST) in einem NxN Maschennetz PE(0,0) als 
Wurzel und die diagonalen PEs (k, N-l-k) , k=0 bis N-l als 
Blatter hat. Der linke Sohn von PE(s,t) der i-ten Stufe (i=l 
bis logN) ist PE(s+2** (logN - i),t) und der rechte Sohn von 
PE(s,t) der i-ten Stufe ist PE(s f t+2** (logN-i) ) . 

Der Steueralgorithmus fUr den ULDST ist nachfolgend aufge- 
f iihrt . 

ULDST ( ) 
{ 

int fs=0, fr=0;/*Flag-Send wird zur Bildung des DST 
verwendet * / 

/*Flag-Receive ist ein Zwischen-var zur Aktualisierung 

von fs*/ 

int pidO,pidl; 

int t;/*t ist der Zeitschritt*/ 

int M,logM;/*M ist die SeitengroBe des Maschennetzes und 
logM=log M*/ 

int treemask=M%2;/*Flag zur Bildung des Baums*/ 
if(pidO==0 && pidl==0){ 



YO 986 025 



- 46 - 

fs «■ l;fr = 1;> 

for (t=0;t<logM;t++) { 

hmask = ANDALLBIT (-treemask | pidO) ; 
vmask -» ANDALLBIT (-'treemask | pidl) ; 
if (-hmask | -vmask) 

{ SHORTJfE ; SHORTENS ; DISABLE ; } 
if (hmask | vmask && fr) 

{E = fs; S = fs; fr « 0;} 
if (hmask | vmask && -fr) 

{fs - W | N; fr = W | N;} 
treemask = ASHIFT (treemask, 1) ; 

} 

> 

Am Beispiel eines 8x8 polymorphen Maschennetzes kann ein 
ULDST-Algorithmus wie folgt erklart werden, Ein Wurzel PE 
(000,000) wird fur den DST ausgewahlt, und seine fs und fr 
werden auf 1 gesetzt. Beim Zeitschritt t=0 sind die Reihen 000 
und 100 sowie die Spalten 000 und 100 aktiv, wahrend der Rest 
deaktiviert ist. Die deaktivierten PEs schlieBen ihr WE und NS 
kurz, um einen vorubergehenden Pf ad zur Aktualisierung von fs 
zu errichten. Das aktive PE mit fr=l sendet seinen fs-Wert zu 
den E- und S-Nachbarn und setzt fr auf 0, so daB es beim 
nachsten Zeitschritt kein Sender mehr ist. Die Empf anger (mit 
fr=0) aktualisieren ihre fs als die Werte von N und W, die 
einer OR-Operation unterzogen wurden. Die Empf anger aktuali- 
sieren ihr fr mit dem Ergebnis, das ebenfalls einer OR-Opera- 
tion unterzogen wurde. Das PE, das eine 1 von N Oder W 
erhalten hat, wird im nachsten Zeitschritt der Sender sein. 
Schritt t«0 wahlt zwei PEs (PE(000,100) und (100,000)) als 
Knoten von DST (durch Einstellen ihres f s=l) . Daruber hinaus 
sorgt dieser Schritt dafiir, daB sie die neuen Sender sind 
(durch fr=l) , um mehr DST-Knoten im folgenden Schritt zu 
setzen. 

Beim nachsten Schritt erzeugt jeder der beiden Sender zwei 
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DST-Knoten und zwei Sender auf gleiche Art und Weise. Die 
neuen Knoten und Sender sind die PEs (000,100), (010,100), 
(100,010) und (100,000). 

Bei t=2 erreicht der Steueralgorithmus die diagonalen PEs; ihr 
fs wird auf 1 gesetzt, um sie als Teil des DST zu kennzeich- 
nen. Dariifoer liinaus wird ihr fr als zusatzliche Information 
auf 1 gesetzt, ura sie als diagonale Knoten zu kennzeiclmen. 
Die diagonale Kennzeichnung ist ein Vorteil des DST-Algorith- 
mus. Sie ist fur viele Berechnungsarten niitzlich, auf die im 
nachfolgenden Absclmitt naher eingegangen wird. 

Um ein DST zu bilden, wird das Flag fs als Bedingung verwen- 
det: PEs mit fs=0 schlieBen WE- und NS-Pfade kurz, wahrend PEs 
mit fs=l MEM zu E und S senden und Daten von W und N empfan- 
gen • 

Unter Verwendung des Mechanismus im Verbindungssteuerblock 
wird die "Baummaske" in SRM geladen, fs in Fl und fr in F2. 
Das UMGEKEHRTE SRM wird mit pidO in Register X bzw. pidl in 
Register Y einer OR-Operation unter zogen; die Ergebnisse aus 
dieser Operation werden einer "ANDALLBIT-Operation" unterzo- 
gen, um "hmask" in XANDALL und "vmask" in YANDALL zu erzeugen. 
Am Ende jedes Schritts wird SRM arithmetisch um ein Bit nach 
rechts verschoben. Die SHORT-MaBnahme beruht dann auf F2, 
XANDAIiL und YANDALL. 

Wenn eine andere Wurzel gewahlt wird, jedoch ein ahnlicher 
Steueralgorithmus verwendet wird, kann ein anderer DST im 
gleiclxen polymorphen Maschennetz gebildet werden. In Figur 20 
ist ein DST mit einer Wurzel in der rechten unteren Ecke zu 
sehen. Dieser Baum wird als URDST bezeichnet. 

Nachfolgend wird erlautert, wie mit ULDST und LRDST A*X-HB*Y-f-c 
parallel fur jedes Pixel (x,y) in einem Bild berechnet werden 
kann. Diese Funktion findet in der Computergraphik und Compu- 
ter Vision breite Anwendung. 
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ANWENDUNGEN 

Neben der bekannten Anwendung eines einfachen Maschennetzes 
ftir die Bildverarbeitung sind die nachfolgend beschriebenen 
Anwendungen des polymorphen Maschennetzes entweder schneller 
im polymorphen Maschennetz oder im einfachen Maschennetz nicht 
implement iert. Diese Anwendungen sind in sechs Arten 
unterteilt . 

( 1 ) Teile-und-Herr sche-Berechnung 

Hierbei wird ein N Datensatz in zwei Gruppen entsprechend 
ihrer Eigenschaft unterteilt. Unter Beriicksichtigung der 
gleichen Eigenschaft wird jede Gruppe noch einmal in zwei 
Untergruppen unterteilt. Dieses Verfahren wird so lange 
wiederholt, bis jede Gruppe nur noch eine Dateneinheit umfafit. 

Fttr die Maschennetzverbindung hat diese Art der Berechnung die 
Komplexitat von O(N) oder hoher. Bei der Transformation zu 
Baumen und Pyramiden ist die Komplexitat dieser Berechnungsart 
O(log N) im polymorphen Maschennetz. Die Beschleunigung fiir 
einen Datensatz von N=1024 ist 100: 1, d.h. eine Verbesserung 
von zwei GroBenordnungen. 

Zu Berechnungen dieser Art gehoren Sortieren, Maximum finden, 
Minimum, k-tes groBtes und mittleres. Alle Algorithmen haben 
die Komplexitat O(log N) . 

(2) Ikonisch-zu-symbolisch Umwandlung 

Diese Berechnungsart wird vor allem bei der Computer Vision 
angewendet und wird auch als Zwischenstufenverarbeitung 
bezeichnet. Bei einem Bild sind viele Punkte interessant: 

(a) wie viele Pixel erfullen eine bestimmte Eigenschaft; 

(b) welche Pixel erfullen die bestimmte Eigenschaft; 

(c) erfiillen EINIGE Oder KEINE oder ALLE Pixel die bestimmte 
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Eigenschaf t ; 

Die oben genannte Eigenschaf t kann sein: 

(a) gleich mit einem Wert; 

(b) groBer als ein Wert; 

(c) kleiner als ein Wert; 

(d) Bedingung arithmetisch und logisch von oben gebildet. 

Diese Algorithmen konnen in O(log N) -Schritten in einem 
polymorphen Maschennetz durch Baum- und Pyramidenstrukturen 
berechnet werden. Viel wichtiger und im Gegensatz zu den 
herkommlichen f est en Strukturen wird nur die Antwort (im 
Gegensatz zum ganzen Zwischenbild) ausgegeben. Dadurch wird 
die I/O-Rate erheblich heruntergesetzt; im Extremfall wird nur 
ein Bit (YES/NO) im Gegensatz zu 1024x1024 Bits (das ganze 
B i Id ) ausgegeben . 

In bezug auf I/O wurde ein zusatzlicher N-S-Pfad zum Maschen- 
netz hinzugeftigt, urn gleichzeitig I/O und die Verarbeitung zu 
unterstiitzen, Dieser Mechanismus und die damit verbundenen 
Vorteile finden auch beim polymorphen Maschennetz Anwendung, 
sind jedoch fur diese Erfindung irrelevant. 

(3) Statistische Messung 

Das polymorphe Maschennetz kann die folgenden Statistiken in 
O(log N)-Schritten berechnen. Die Statistiken umfassen 

(a) mittlere, Varianz- r Standardabweichung; 

(b) Bereich, Perimeter, Schwerpunkt; 

(c) erstes Moment, zweites Moment und Kreuzmoment; 

Punkt (a) bezieht sich auf einen N Datensatz, wahrend Punkt 
(b) und (c) sich auf ein Bild beziehen. 

Die Statistiken bilden die Grundlage fur andere Algorithmen. 
Bei der Computer Vision stellen sie die Basis fur Bereichsana- 
lyse und Strukturerkennung dar. 
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(4) Berechnung von A*x-HB*y+C 

Urn A*x+B*y-hC zu berechnen, miissen vier Strukturen vom polymor- 
phen Maschennetz gebildet werden: oberer-Linker-Diagonal-Span- 
Tree (ULDST) , Unterer-Rechter-DST (LRDST) , Reihenbusse und 
Spaltenbusse. Der ULDST und LRDST mussen zusammen vorhanden 
sein, um A*X+C und B*Y gleichzeitig zu berechnen, wahrend die 
Reihen- und Spaltenbusse zusammen vorhanden sind, um die Summe 
zu berechnen (z.B. A*X-KH-B*Y) . 

Der Algorithmus wird auf bitserielle Art und Weise durchge- 
fiihrt. Die beiden zusatzlichen Baume in der Pixelebene konnen 
weggelassen werden. Die konstanten Argumente A und B werden 
vor Beginn der Berechnung an alle PEs weitergeleitet und im 
Feld A und B gespeichert, wobei die "0" von (logM-1) am Beginn 
der Felder preempt iert werden. Das Speichern von A und B 
erfolgt bituragekehrt , so daB nach dem Zugriff auf die preemp- 
tierten "0" auf das niedrigwertigste Bit von A und B zuerst 
zugegriffen wird. Das konstante Argument C wird zura polymor- 
phen Maschennetz uber W der Wurzel des ULDST bei einem Bit pro 
Zeitschritt gefiihrt, wobei beim niedrigwertigsten Bit begonnen 
wird. Wenn ULDST als Baum zur Berechnung von A*X+C verwendet 
wird, hat jedes PE drei Variablen (Summe, Ubertrag und Verzo- 
gerung) . Bei jedem Zeitschritt geht "Summe" in Richtung Osten 
und "Verzogerung" in Richtung Siiden, wahrend jedes PE zwei 
Operationen durchfuhrt: (a) N bei Feld A hinzufugen, das Ober- 
tragbit bei "Obertrag" speichern und (b) N bei "Verzogerung" 
speichern. Nach logM-Schritten speichern die diagonalen PEs 
des Maschennetzes (oder die Blatter des ULDST) A*X fiir die 
entsprechende Reihe. Auf ahnliche Art und Weise kann die 
Berechnung von B*Y durch LRDST durchgefuhrt werden, indem "0" 
von der Wurzel eingefiihrt wird, und mit jedem PE "Verzogerung" 
in Richtung Norden und "Summe" in Richtung Westen geht. Nach 
logM-Schritten speichern die diagonalen Elemente B*Y fur jede 
entsprechende Spalte. 

Nach der Berechnung von A*X+C fiir Reihen und B*Y fiir Spalten 
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geht das polymorphe Maschennetz auf Reihenbusse im WE-Pfad und 
Spaltenbusse im NS-Pfad tiber. Jedes PE addiert dann den Wert 
auf den Reihenbussen zu dem Wert auf den Spaltenbussen, urn 
A*X+B*Y+C auf bitserielle Art und Weise zu erzeugen. 

Da ein Ressourcenkonf likt bei der gleichzeitigen Einrichtung 
der DSTs und Busse vorhanden ist, wird das Ergebnis von 
A*X+B*Y+C bitseriell bei jedem Zeitschritt gegeben. 

(5) Schnelle Zeilendetektion 

Wenn A*X+B*Y+C in jedem zweiten Zeitschritt des polymorphen 
Maschennetzes berechnet werden kann, 1st jedes Pixel (X,Y) in 
einem MxM Bild in der Lage festzustellen, ob es sich auf einer 
gegebenen Zeile befindet, die von A, B und C festgelegt wird. 
Wenn alle Zahlen die LSnge von K-Bits haben, kann dies in 
logM+2K Zeitschritten festgestellt werden. 

Die schnelle Zeilendetektion ist vor allem in der Computergra- 
phik und Computer Vision sehr niitzlich. Bei der Computergra- 
phik dient es vornehmlich zur Anzeige von konvexen Polygonen, 
zur Erzeugung von Schatten, zum Clipping, zum Zeichnen von 
Kugeln, zum Berechnen adapt iver Histogrammgleichstellungen, 
zur Texturabbildung und zum Antialiasing. Bei der Computer 
Vision eignet es sich vor allem fur die Berechnung von Past 
Hough Transform zur Erfassung von Zeilen in einem Rauschbild. 

(6) Umwandlung symbolischer Daten in ikonische Daten 

Bei der in polymorphen Maschennetzen vorhandenen parallelen 
Hardware ist es von Vorteil, symbolische Daten in ikonische 
Daten umzuwandeln (dies wird normalerweise nicht in Maschen- 
netzen durchgefiihrt) , so daB die Verarbeitung parallel 
erfolgen kann. Die oben erwahnte Fast Hough Transform ist ein 
solches Beispiel. Die nachfolgend beschriebene 
"Maskenerzeugung" ist eine weitere Klassenanwendung dieser 
Art, 
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(6.1) Bandmaskenerzeugung 

Eine "Bandmaske" bef indet sich innerhalb zweier parlleler Zei- 
len, von denen eine durch (A, B, CI) und die andere durch (A, 
B, C2) festgelegt wird. Zur Erzeugung einer "Bandmaske" 
berechnet jedes PE wie oben beschrieben A*X-f-B*Y+Cl und 
A*X-fB*Y-f-C14-(C2-Cl) • Aus <* er Berechnung ergibt sich SI (das 
Vorzeichen von A*X+B*Y+ci) und S2 (das Vorzeichen von 
A*X-H3*Y+C2 ) , die beide verwendet werden # um festzulegen, ob 
sich ein Pixel (X,Y) im Band bef indet. 

Die "Bandmaske" eignet sich insbesondere fur Computer Vision, 
da nur der Bereich von Interesse verarbeitet wird. Die 
menschliche Sicht benutzt eine andere Strategie zur Erzeugung 
von Masken. Die "Strategie" ist eine symbolische Information, 
die jedoch wie beschrieben ikonisch verarbeitet wird. 

(6.2) Po ly gonmaskener z eugung 

Die "Polygonmaske" ist die allgemeine Form einer Bandmaske. 
Sie besteht aus der Verbindung von P Halbebenen, die jeweils 
von einer Zeile aus A*X-HB*Y+c bestimmt werden. Mit Hilfe der 
Zeilendetektion konnen die Vorzeichen SI, S2 bis SP fiir die 
entsprechende Zeile berechnet werden. Die Boolesche Verbindung 
von SI bis Sp legt fest, daB sich ein Pixel (X,Y) im Polygon 
bef indet. 



Z US AMMENF AS SUNG 

Im bevorzugten Ausfuhrungsbeispiel der Erfindung werden unter 
Steuerung des Verbindungssteuermechanismus folgende Transfor- 
mationen durchgeftihrt: 

Die physische MxM Maschennetzverbindung zu einem linearen 
Reihen- und Spaltenfeld, das jeweils MxM lang ist. 
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Die physische MxM Maschennetzverbindung zu M Reihenbaumen, die 
jeweils M Blatter haben. 

Die physische MxM Maschennetzverbindung zu M Spaltenbaumen, 
die jeweils M Blatter haben. 

Die physische MxM Maschennetzverbindung zu einem MxM orthogo- 
nal en Baum. 

Die physische MxM Maschennetzverbindung zu M Umkehrreihenbau- 
men, die jeweils M Blatter haben. 

Die physische MxM Maschennetzverbindung zu M Umkehr spaltenbau- 
men, die jeweils M Blatter haben. 

Die physische MxM Maschennetzverbindung zu M Reihenbussen, die 
jeweils M PEs haben. 

Die physische MxM Maschennetzverbindung zu M Spaltenbussen, 
die jeweils M PEs haben. 

Die physische MxM Maschennetzverbindung zu einer Pyramide mit 
einer MxM Basis und einer Schrumpfung K, wobei K eine Potenz 
von 2 ist. 

Die physische MxM Maschennetzverbindung zu einer Umkehrpyra- 
mide mit einer MxM Basis und einer Schrumpfung K, wobei K eine 
Potenz von 2 ist. 

Die physische MxM Maschennetzverbindung zu einem MxMxK Wurfel, 
wobei K eine ganze Zahl ist und nur durch den lokalen Speicher 
des PE begrenzt wird. 

Das Verfahren der Erfindung ftihrt unter Programmiersteuerung 
auBerhalb des Verbindungssteuermechanismus folgende Transfor- 
mationen durch: 
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Die physische MxM Maschennetzverfoindung zu einem DST-Baum, 
dessen Wurzel sich an einer beliebigen Ecke des Maschennetzes 
befinden kann. Es konnen bis zu zwei DST zusammen vorhanden 
sein, wenn ihre Wurzeln sich an entgegengesetzten Enden einer 
Diagonale befinden. 

Die physische MxM Maschennetzverbindung zu einem MxM orthogo- 
nalen Baum in einem 0(M**2) Siliziumbereich. Durch das Verfah- 
ren der Erf indung kann eine Einsparung in der GroBenordnung 
eines Faktors von 0(logM)**2 )erzielt warden, wobei M die 
SeitengroBe des orthogonalen Baums ist. 

Die Klasse der Teile-und-Herrsche~Algorithmen von linearer 
O(M) Komplexitat zu einer 0(log M) Logarithmuskomplexitat . 
Durch das Verfahren der Erf indung kann eine Einsparung von 
M/logM erzielt werden. Diese Algorithmusklasse wird in der 
Beschreibung des bevorzugten Ausffihrungsbeispiels dargestellt. 

Die ikonisch-zu-symbolisch Umwandlung 

(Zwischenstufenverarbeitung) tritt innerhalb des polymorphen 
Maschennetzes auf , so daB die I/O erheblich reduziert werden 
kann. Im Extremfall, der bei der Beschreibung des bevorzugten 
Ausftihrungsbeispiels der Erf indung naher dargelegt wird, ist 
eine Reduzierung von sechs GroBenordnungen raoglich. 

Die symbolische Darstellung kann rait Hilfe der oben genannten 
Strukturen in ikonische Darstellung umgewandelt werden, so daB 
die Verarbeitung ikonisch mit einer im Maschennetz zur 
Verfiigung stehenden Parallelitat durchgefuhrt werden kann. 
Diese Funktion erweitert die Fahigkeiten eines Maschennetzes 
bis in den Bereich der symfoolischen Verarbeitung. 

Das Maschennetzsystem kann folgendes durchfuhren: 

(a) ikonische Verarbeitung; 

(b) Umwandlung von ikonischen Daten in symbolische Daten; 
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(c) Umwandlung von symbolischen Daten in ikonische Daten und 

(d) symbol ische Verarbeitung in der entsprechenden ikonischen 
&quivalenz . 

Das Verfahren der Erfindung ermoglicht die Berechnung von 
A*x-HB*y+C in einem MxM Maschennetz in O(log M) Schritten 
parallel fiir jedes Pixel (x,y) , wobei A, B und C konstante 
ganze Zahlen sind. 

Mit Hilfe des Verfahrens der Erfindung kann fur jedes Pixel 
(x,y) in einem MxM Bild erfaBt werden, ob sich das Pixel (x,y) 
(a) auf der Zeile, (b) rechts von der Zeile oder (c) links von 
der Zeile in einem O(log M) Schritt befindet. 

Das Verfahren der Erfindung ermoglicht es, daB bei jedem Pixel 
(x,y) in einem MxM Bild parallel erfaBt werden kann, ob sich 
das Pixel innerhalb Oder auBerhalb eines Bandes befindet , 
wobei das Band von zwei paralleln Zeilen gebildet wird. 

Das Verfahren der Erfindung ermoglicht es, daB bei jedem Pixel 
(x,y) in einem MxM Bild parallel erfaBt werden kann, ob es 
sich innerhalb oder auBerhalb eines Polygons befindet. 

Die Erfindung findet auch auf ein 3D~Maschennetz (physischer 
Wiirfel) Anwendung, um eine Dimensionserweiterung der zwolf 
Strukturen zu erzielen, indem ein Register Z, ein Schieberegi- 
ster SRZ und ein Flag F3 zum Verbindungssteuermechanismus 
hinzugefugt wird. (die Dimensionserweiterung eines Wiirfels ist 
z*B. ein 4D Hyperwiirfel) . 

* 

Das 3D Bildelement ist ein Voxel. Das Voxel ist das Vo lumen- 
element, ahlich wie das 2D Pixel, das nur tiber Bereich 
verfiigt. Bei der 3D Erweiterung der Erfindung kann fiir jedes 
Voxel (x,y,z) parallel erfaBt werden, ob es sich innerhalb 
oder auBerhalb 

(a) eines Bereichs befindet, der von zwei parallelen Ebenen 
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gebildet wird, 

(b) eines Polyhedrons befindet, Oder 

(c) ob das Voxel in, links oder rechts einer Ebene ist. 

Die Erfindung bezieht "polymorph" auf ein physisches Maschen- 
netz iiber einen "Verbindungssteuermechanismus". Das gleiche 
Konzept und der gleiche Mechanismus konnen auch auf andere 
physisch feste Verbindungen angewendet werden. 

Die vom polymorphen Maschennetz gebildeten Strukturen konnen 
der Datennatur angepaBt werden, indem die Fl und/oder F2 
Register iiber den Ausgang der ALU beladen werden. 

Mit dem polymorphen Maschennetz konnen auch beliebige Struktu- 
ren gebildet werden, indem die Fl- und F2 -Register durch 
Befehle oder den Speicher eingestellt werden. Ein Befehl, ein 
Speicherwert, Zwischenverarbeitungswerte von einem benachbar- 
ten Verarbeitungselement und Diagnosedaten innerhalb des 
Verarbeitungselements sind Beispiele fiir Systemoperationspara- 
meter, die zur Einstellung der Flag-Register mittels bekann- 
ter, hier nicht erlauterter Techniken und Mittel verwendet 
werden konnen. Der Verbindungssteuermechanismus umfaBt somit 
Flag-Registermittel, die als Funktion von Systemoperationspa- 
rametern eingestellt werden konnen, urn Steuerdaten bereitzu- 
stellen, die fur das Einstellen einer neuen Struktur in minde- 
stens einem Struktur register verwendet werden. Mit Hilfe 
dieser fiir den Programmierer zuganglichen Eigenschaft kann 
dieser Anpassungen an datenbezogene und bedingungsbezogene 
kiinftige Ereignismoglichkeiten einstellen. Nach Eintritt eines 
Ereignisses wird ein Flag-Register eingestellt und eine neue 
Struktur geholt oder berechnet. 
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ANSPRUCHE 

1. Ein wiederkonf igurierbares Feldverarbeitungssystem zur 
Durchfuhrung einer Reihe von Tasks auf Eingangsbilder 
unter programmier barer Steuerung, wobei das System 
verschiedene optimale Konf igurationen bei verschiedenen 
Zeiten und unter verschiedenen Bedingungen hat, zu denen 
folgendes gehort: 

Systemsteuermittel ( 3 ) 

ein Feld von Verarbeitungselementen (2), wobei jedes 
Verarbeitungselement mit einer begrenzten Anzahl von 
benachbarten Verarbeitungselementen im Feld verbunden ist, 

und wobei jedes Verarbeitungselement urafaBt: 

einen Speicher (7) ; 

eine ALU (6) , die mit dem Speicher verbunden ist; und 

ein Verbingungssteuermittel (8) , mit einer begrenzten 
Anzahl von einfachen Verbindungspf aden zur ALU (6) und zu 
einer begrenzten Anzahl von benachbarten Verarbeitungsele- 
menten (2), mit Schaltmittelh (10) zur Bildung selektiver 
interner und externer Zwischenverbindungen des Verarbei- 
tungselement s, um die Kommunikation mit einem nicht 
benachbarten Zielverarbeitungselement fiber zahlreich 
auftretende Verarbeitungselemente entsprechend einer 
Verbindungssteuerstruktur zu ermdglichen, und Mittel fur 
eine schaltbare Verbindungssteuerstruktur, die Darstel- 
lungsmittel (21, 22) umfaBt, die dem Verarbeitungsmittel 
zahlreiche Strukturbitwerte bereitstellt , die eine Stan- 
dardmenge von Strukturwerten und eine alternative Menge 
von Strukturwerten festlegen, sowie ein Strukturwert- 
auswahlmittel (23) zur Auswahl der Standardmenge von 
Strukturwerten Oder zur Auswahl der alternativen Menge von 
Strukturwerten, wobei die Schaltmittel (10) auf die 
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ausgewahlten Strukturbitwerte reagieren. 

2. Ein System nach Anspruch 1, bei dem der Verbindungssteuer- 
mechanismus (8) zahlreiche Strukturregister (21 , 22) , 
einschlieBlich einem St andardstruktur register und einem 
alternativen Strukturregister umfaBt, sowie einen 
Crossbar-Schalter (10) mit externen Verbindungen zu 
benachbarten Verarbeitungs element en und internen Verbin- 
dungen zu den zahlreichen Strukturregistern und der ALU 
(6) , und mit Steuerverbindungen zu den zahlreichen Struk- 
turregistern; des weiteren Mittel zur Steuerung des 
Verbindungssteuermechanismus entsprechend einer Optimie- 
rungsstruktur , einschliefclich Gate-Schaltmitteln (16-20) , 
die auf die Einstellung im ausgewahlten Strukturregister 
reagieren • 

3 . Ein System nach Anspruch 2 , bei dem der Verbindungssteuer- 
mechanismus zwei Strukturregister (21, 22) umfafct sowie 
das Strukturauswahlmittel, das ein Strukturregister als 
binare Einrichtung (23) auswahlt. 

4. Ein System nach Anspruch 2, bei dem der Verbindungsstruk- 
turmechanismus Flag-Registermittel (31, 32) umfaBt, und 
die Flag-Registermittel als Verbindung von Systemoperati- 
onsparametern eingestellt werden konnen, urn Steuerdaten 
bereitzustellen, die fiir die Einstellung einer neuen 
Struktur in mindestens einem der Strukturregister benutzt 
werden konnen. 
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